基於序列項目的rethinkdb聚合

我目前正在通過rethinkdb python tutorial。基於序列項目的rethinkdb聚合

目前，我有4個超級英雄。在下面的示例中，heroes是r.db("python_tutorial").table("heroes")的別名。

In[45]: list(heroes.run()) 
Out[44]: 
[{u'appearances_count': 98, 
    u'hero': u'Wolverine', 
    u'id': u'28b6a53f-14c6-4a36-bb0b-45a6fb9c77c9', 
    u'magazine_titles': [u'Amazing Spider-Man vs. Wolverine', 
    u'Avengers', 
    u'X-MEN Unlimited', 
    u'Magneto War', 
    u'Prime'], 
    u'name': u"James 'Logan' Howlett"}, 
{u'aka': [u'Magnus', u'Erik Lehnsherr', u'Lehnsherr'], 
    u'appearances_count': 42, 
    u'hero': u'Magneto', 
    u'id': u'19274b39-f829-4daa-ba2b-24fd680e01c6', 
    u'magazine_titles': [u'Alpha Flight', u'Avengers', u'Avengers West Coast'], 
    u'name': u'Max Eisenhardt'}, 
{u'appearances_count': 72, 
    u'hero': u'Storm', 
    u'id': u'69848f10-2f5a-48f4-8d87-c310b88f9487', 
    u'magazine_titles': [u'Amazing Spider-Man vs. Wolverine', 
    u'Excalibur', 
    u'Fantastic Four', 
    u'Iron Fist'], 
    u'name': u'Ororo Monroe'}, 
{u'appearances_count': 72, 
    u'hero': u'Professor Xavier', 
    u'id': u'22dd3ab1-60d6-4679-9c39-2ad7da6e48d0', 
    u'magazine_titles': [u'Alpha Flight', u'Avengers', u'Bishop', u'Defenders'], 
    u'name': u'Charles Francis Xavier'}]

我會像向做的是英雄羣像按照雜誌的標題，他們在所以，我試圖建立一個查詢時，會看到這樣的以下內容：

u'Prime' 
{ u'name': u"James 'Logan' Howlett"} 
u'Fantastic Four' 
{ u'name': u'Ororo Monroe'} 
u'Excalibur' 
{ u'name': u'Ororo Monroe'} 
u'Defenders' 
{ u'name': u'Charles Francis Xavier'} 
u'Magneto War' 
{ u'name': u"James 'Logan' Howlett"} 
u'Bishop' 
{ u'name': u'Charles Francis Xavier'} 
u'Avengers West Coast' 
{ u'name': u'Max Eisenhardt'} 
u'Amazing Spider-Man vs. Wolverine' 
{ u'name': u"James 'Logan' Howlett"} 
{ u'name': u'Ororo Monroe'} 
u'X-MEN Unlimited' 
{ u'name': u"James 'Logan' Howlett"} 
u'Alpha Flight' 
{ u'name': u'Charles Francis Xavier'} 
{ u'name': u'Max Eisenhardt'} 
u'Avengers' 
{ u'name': u"James 'Logan' Howlett"} 
{ u'name': u'Charles Francis Xavier'} 
{ u'name': u'Max Eisenhardt'} 
u'Iron Fist' 
{ u'name': u'Ororo Monroe'}

我已設法通過兩個單獨查詢。這裏基本上是我所做的：

In[46]: titles = list(heroes.concat_map(lambda hero: hero["magazine_titles"]).distinct().run()) 
In[47]: titles 
Out[46]: 
[u'Alpha Flight', 
u'Amazing Spider-Man vs. Wolverine', 
u'Avengers', 
u'Avengers West Coast', 
u'Bishop', 
u'Defenders', 
u'Excalibur', 
u'Fantastic Four', 
u'Iron Fist', 
u'Magneto War', 
u'Prime', 
u'X-MEN Unlimited']

上面給出了我所有標題的列表。然後，我只是搜索數據庫，看看這些標題是不是英雄的magazine_titles。像這樣：

In[48]: from collections import defaultdict 
In[49]: title_data = defaultdict(list) 
In[57]: for title in titles: 
...   title_data[title] = list(heroes.filter(lambda hero: hero["magazine_titles"].contains(title)).pluck("name").run()) 
In[59]: for title, heroes in title_data.items(): 
...  pprint(title) 
...  pprint(heroes, indent=4)

不過，我想這樣做是一個查詢。關於所述查詢，它會比像我這樣做兩個單獨的查詢更有效嗎？

來源

2015-05-13 Games Brainiac

的group命令multi應該做你想要什麼：

heroes.group('magazine_titles', multi=True)['name']

來源

2015-05-13 14:26:04 AtnNn

太謝謝你了！有沒有我可以使用的食譜？或者我可以使用的任何預創建的數據集都有複雜的數據類型？ –

我不認爲這確實存在，但是您可以使用'r.http'命令從公共apis導入數據（例如，像Reddit）。 'r.db（ '數據庫'）。表（ '書籤交易'）.insert（r.http（ 'http://www.reddit.com/r/javascript.json'）（ '數據'）（'兒童）.MAP（r.row（ '數據'）））' –

基於序列項目的rethinkdb聚合

回答

相關問題