模式匹配，多個數據集匹配百分比

-2

我沒有開發經驗，但我正在尋找人來創建一個web應用程序，可以做什麼，據我所知，被稱爲「模式匹配」。

例如，基本上我想比較兩個數據集來計算「重疊」的百分比。

集一：

組兩個：

但是我想通過很多很多的實例/比較（可能有幾十萬）來做到這一點。有沒有人有任何想法來實現這樣的技術和語言等是必要的，以及我可以問什麼問題以確保我正在採訪的人能夠實施它？

感謝您的任何建議！

2015-10-16 user62808

我很困惑你的問題描述。一個集合包含不同的值，但是你的兩個例子都有重複的'A'和'B'。你對他們有什麼期望？ –

請不要在多個網站..... [DBA]（http://dba.stackexchange.com/q/118301/72091）和[DataScience]（http://datascience.stackexchange。 com/q/8470） – Erik

我投票結束這個問題作爲題外話題，因爲它是關於篩選招聘的候選人。 –

你用錯詞了一切......

你在找什麼是相似度爲的列表，但一個非常基本的形式，你只需要做，就沒有工具或問題可以幫助你，因爲它只是計算。人們不寫計算的教程。

2015-10-17 11:28:48

回答