2015-10-16 107 views
-2

希望這是正確的地方問這個!模式匹配,多個數據集匹配百分比

我沒有開發經驗,但我正在尋找人來創建一個web應用程序,可以做什麼,據我所知,被稱爲「模式匹配」。

例如,基本上我想比較兩個數據集來計算「重疊」的百分比。

集一:

  1. 一個
  2. 一個

組兩個:

  1. 一個
  2. B

但是我想通過很多很多的實例/比較(可能有幾十萬)來做到這一點。有沒有人有任何想法來實現這樣的技術和語言等是必要的,以及我可以問什麼問題以確保我正在採訪的人能夠實施它?

感謝您的任何建議!

+0

我很困惑你的問題描述。一個集合包含不同的值,但是你的兩個例子都有重複的'A'和'B'。你對他們有什麼期望? –

+2

請不要在多個網站..... [DBA](http://dba.stackexchange.com/q/118301/72091)和[DataScience](http://datascience.stackexchange。 com/q/8470) – Erik

+2

我投票結束這個問題作爲題外話題,因爲它是關於篩選招聘的候選人。 –

回答

0

你用錯詞了一切......

  • 你的「套」實際上是名單
  • 要計算的相似性,但不比賽他們
  • 有沒有在你的問題「模式」的概念

你在找什麼是相似度爲的列表,但一個非常基本的形式,你只需要,就沒有工具或問題可以幫助你,因爲它只是計算。人們不寫計算的教程。