2016-04-28 51 views
0

當羣集中的一個節點重新啓動時,我的節點日誌充斥着警告消息「將單播消息丟棄到錯誤的目標」。 我們正在使用Jgroups,TCP,jgroups-3.4.1.Final版本。 我的服務器不上來,用contagiously泛起沒有物理地址用於x,在jgroups羣集中的節點重新啓動時丟棄消息

下面是警告消息這些警告消息 [0; 33mWARN [TransferQueueBundler,H廣播,H-13] [TCP] JGRP000032:H-13:無物理地址8281f201-7fb1-f6ac-faf3-d6837bc39087,滴消息

[0; 33mWARN [INT-1,H-廣播,H-13] [TCP] JGRP000031:H-13:丟棄單播消息錯目的地d205fcba-151C-ad58-8323-fe4f49117f88

請讓我知道如何解決這個問題

個感謝, Nivedita

<TCP loopback="true" 
    recv_buf_size="${tcp.recv_buf_size:20M}" 
    send_buf_size="${tcp.send_buf_size:640K}" 
    discard_incompatible_packets="true" 
    max_bundle_size="64K" 
    max_bundle_timeout="5" 
    enable_bundling="true" 
    use_send_queues="true" 
    sock_conn_timeout="300" 
    timer_type="new" 
    timer.min_threads="4" 
    timer.max_threads="10" 
    timer.keep_alive_time="3000" 
    timer.queue_max_size="500" 
    thread_pool.enabled="true" 
    thread_pool.min_threads="4" 
    thread_pool.max_threads="10" 
    thread_pool.keep_alive_time="5000" 
    thread_pool.queue_enabled="true" 
    thread_pool.queue_max_size="100000" 
    thread_pool.rejection_policy="discard" 
    oob_thread_pool.enabled="true" 
    oob_thread_pool.min_threads="1" 
    oob_thread_pool.max_threads="8" 
    oob_thread_pool.keep_alive_time="5000" 
    oob_thread_pool.queue_enabled="false" 
    oob_thread_pool.queue_max_size="100" 
    oob_thread_pool.rejection_policy="discard" 
    bind_addr="${hybris.jgroups.bind_addr}" 
    bind_port="${hybris.jgroups.bind_port}" /> 
<TCPPING timeout="3000" 
    initial_hosts="xxx.xx.xx.4[7800],xxx.xx.xx.5[7800],xxx.xx.xx.6[7800], xxx.xx.xx.7[7800], xxx.xx.xx.8[7800], xxx.xx.xx.9[7800], xxx.xx.xx.10[7800], xxx.xx.xx.11[7800], xxx.xx.xx.12[7800], xxx.xx.xx.13[7800], xxx.xx.xx.68[7800], xxx.xx.xx.69[7800], xxx.xx.xx.70[7800], xxx.xx.xx.4[7800], xxx.xx.xx.5[7800], xxx.xx.xx.6[7800]" 
    num_initial_members="16"/> 

<MERGE2 min_interval="10000" max_interval="30000" /> 
    <FD_SOCK /> 
    <FD timeout="3000" max_tries="3" /> 
    <VERIFY_SUSPECT timeout="1500" /> 
    <BARRIER /> 
    <pbcast.NAKACK use_mcast_xmit="false" exponential_backoff="500" discard_delivered_msgs="true" /> 
    <UNICAST2 /> 
    <pbcast.STABLE stability_delay="1000" desired_avg_gossip="50000" max_bytes="4M" /> 
    <pbcast.GMS print_local_addr="true" join_timeout="3000" view_bundling="true" /> 
    <UFC max_credits="20M" min_threshold="0.4" /> 
    <MFC max_credits="20M" min_threshold="0.4" /> 
    <FRAG2 frag_size="60K" /> 
    <pbcast.STATE_TRANSFER /> 

回答

2

非常感謝您的建議。 當有問題的節點之一被關閉時(它無法telnet與其他能夠telnet的節點相比),羣集節點自行修復自己

+0

我無法清楚地得到這個答案。亞姆得到同樣的問題!我應該如何在jgroups集羣中進行配置? – NandhaKumar

+1

在羣集中的節點中,其中一個節點出現網絡問題,我們無法在其上的7800端口上進行遠程登錄。當從集羣中刪除故障節點時,節點自愈並加入集羣 –

+0

無論如何,感謝您的解決方案!在我的情況下,我可以使用telnet連接節點,但無法加入羣集。我不知道問題在哪裏。 – NandhaKumar

2

我假設你使用TCP:TCPPING?您是否列出全部會員TCPPING.initial_hosts?這是上述警告最可能的原因。

有一個緩存將UUID(JGroups集羣成員的內部表示)映射到每個成員的物理地址。

您可以通過JMX或probe.sh uuids查看內容。在h13中應該有一個映射8281f201-7fb1-f6ac-faf3-d6837bc39087,但它缺失。同樣,最可能的原因是h13未在TCPPING中列出。

你可以嘗試的可選發現協議(例如MPING如果IP多播被支持,FILE_PING這需要一個共享文件系統,TCPGOSSIP與外部查找服務等)。詳細信息請查看手冊。

+0

是的,我們已經列出了所有主機在initial_hosts屬性中JGroups的-tcp.xml。我們正在使用不支持多播的天藍雲,因此我們無法使用多播。 。請在下面找到jgroups-tcp.xml配置 –

+0

粘貼問題 –

+0

中的jgroups-tcp.xml配置嘗試使用探測命令,但沒有返回任何結果。如果探測器使用多播,我認爲它不會工作。如果我可以使用任何其他機制,您可以請幫助 –

相關問題