這是一個關於考慮到不同參數的數據標準化的問題。標準化[0 -1]範圍內的值
我在網站上有一組文章。用戶使用評分系統並評分1至5星的文章。 1星級意味着一篇不好的文章,並標記文章「不好」。 2星給予'平均'評級。 3,4和5星評價「好」,「非常好」和「優秀」。
我想在[0 - 2]範圍內規範化這些評級。規範化的值將代表一個分數,並將用作在文章列表中增加或減少文章的因子。具有2個或更少星號的文章應該在[0-1]的範圍內得分,所以這個提升因子會有負面影響。具有2個或更多星級評分的文章應該在[1-2]的範圍內得分,所以這個提升因子會有一個積極的提升。
因此,例如,擁有3.6顆星的文章將獲得1.4的提升係數。這將推動文章上市的文章。一篇1.9星的文章將得到0.8分。這個分數將會進一步推動該文章在上市中的表現。一篇2星的文章會得到1的提升因子 - 沒有提升。
此外我想考慮每篇文章的票數。一票三星的文章排名要差於平均4票和2.8星的文章。 (助推係數分別爲1.2和1.3)
那麼你的問題是什麼?看起來你已經很好了。繼續下去這個思路,你可能會想出來。 – Tenner