我有n個隊列中的事物,我必須根據開放標準類別C {X,Y Z)(此處X,Y,Z是C變體)找到最佳可能事物。在最短的時間複雜度下,什麼是最好的通用算法?員工候選人名單
如:
比方說,一個公司在發佈C++,C,銀行領域,STL,5 - 10年工作......等等。 100人申請同一職位。一些在C中有exp,一些在C++,Java中。一些有C,C++,電信域...等等。我的問題在於:如何找到最好的員工?如何對他們進行排名?
我有n個隊列中的事物,我必須根據開放標準類別C {X,Y Z)(此處X,Y,Z是C變體)找到最佳可能事物。在最短的時間複雜度下,什麼是最好的通用算法?員工候選人名單
如:
比方說,一個公司在發佈C++,C,銀行領域,STL,5 - 10年工作......等等。 100人申請同一職位。一些在C中有exp,一些在C++,Java中。一些有C,C++,電信域...等等。我的問題在於:如何找到最好的員工?如何對他們進行排名?
我現在沒有真正的算法,但計算排名的方法可能是計算每個員工與工作標準相同的項目數,並將其與總數項目。例如:如果作業有標準:Java, SQL, PHP
(3項)和emplyoyee只已記錄在PHP和Java(2項)的秩r可以計算爲:r = (employee_items)/(total_items) = 2/3
您可以在工作中的權重也增加了每個項目描述,以確定更重要的項目。所以也許Java很重要 - 它得到1.5,SQL正常-1和PHP不太重要0.8。然後employee_items可能1.5 * 1 + 0.8 * 1
這是怎麼我會嘗試開始
你可能需要某種形式的所產生,轉化每個標準字(S)爲規範標準字(S)讓標準更好地匹配。
例如:
我想從Lucene的英文詞幹開始,並擴展它。
粗略的想法,
綜合考慮公司的需求作爲搜索矢量和恢復爲文檔的排名。
要微調選擇, - 給重候選的位置和工作地點 - 現有員工 - 當前CTC /預期CTC - 正常化與其他候選人的得分/創建百分
使用的見解(如果你真的想出售候選人到公司), - 根據公司選擇什麼樣的候選人來選擇權重 - 對活躍的候選人加權,如何找到他們? - 另一個問題:)
您好,我的工作與您在此處描述的相同場景有關,但這適用於線性搜索和排序。這裏的時間複雜度非常高。 – Prasanna 2011-03-11 11:14:44
正確的,你可以嘗試[獅身人面像](http://sphinxsearch.com)作爲候選列和僱主要求的通用權重作爲搜索標準。 – 2011-03-11 16:06:02
我在這裏可以真正建議的是爲每個標準分配值,並在恢復中獲得更多關鍵字 – 2011-03-11 07:14:36
的總和!=最好的僱員。你需要看一個更好的方式聘請;) – zengr 2011-03-11 08:06:15
你好Zengr,我設計過濾器按照僱主的預期。只有你有更好的想法才能在簡歷的基礎上分享候選人名單。我們歡迎您的建議:) – Prasanna 2011-03-11 11:25:41