2017-02-27 50 views
1

我正在使用apache cassandra 2.2.4。我有一個在DC1中具有複製因子3並且在DC2中具有複製因子1的4(四)節點羣集,其中DC1包含3(三)個節點並且DC2包含1(一個)節點。在這個集羣中有更多的節點,但由於某種原因,我刪除了它們,並沒有改變複製場景。 [請考慮下面的IP的不是原創]請求期間出現意外異常

Datacenter: DC1 
=============== 
Status=Up/Down 
|/ State=Normal/Leaving/Joining/Moving 
-- Address  Load  Tokens  Owns Host ID        Rack 
UN 21.12.19.91 4.08 GB 256   ?  a45bb676-1ddd-4b22-933b-58653cea680f RAC1 
UN 21.12.19.92 3.92 GB 256   ?  a7735fca-8671-4a20-a759-4a2681aed37e RAC1 
UN 21.12.19.93 4.47 GB 256   ?  d98f3cad-881a-41c8-89c7-170c63c3d236 RAC1 
Datacenter: DC2 
=============== 
Status=Up/Down 
|/ State=Normal/Leaving/Joining/Moving 
-- Address  Load  Tokens  Owns Host ID        Rack 
UN 21.12.19.99 3.84 GB 256   ?  ccd9ca97-f97a-4473-9a65-49b12a1b60ba RAC1 

集羣工作正常,但現在給天我有一個問題,INFO。我試圖分析這個問題,但還沒有做到。有沒有人熟悉以下情景?

INFO [SharedPool-Worker-2] 2017-02-26 06:56:48,520 Message.java:605 - Unexpected exception during request; channel = [id: 0x637a702c, /18.12.10.17:60926 :> /21.12.19.91:9042] 
java.io.IOException: Error while read(...): Connection reset by peer 
    at io.netty.channel.epoll.Native.readAddress(Native Method) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollSocketChannel$EpollSocketUnsafe.doReadBytes(EpollSocketChannel.java:675) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollSocketChannel$EpollSocketUnsafe.epollInReady(EpollSocketChannel.java:714) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollEventLoop.processReady(EpollEventLoop.java:326) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollEventLoop.run(EpollEventLoop.java:264) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:116) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.util.concurrent.DefaultThreadFactory$DefaultRunnableDecorator.run(DefaultThreadFactory.java:137) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at java.lang.Thread.run(Thread.java:745) [na:1.8.0_66] 
+0

什麼是IP 18.12.10.17(例外)? – Ralkie

+0

其開發者結束了IP。 –

回答

0

請確保您的防火牆沒有丟棄正在使用的TCP連接。所有節點上的Tcp保持活動狀態必須小於防火牆設置。有關TCP設置的詳細信息,請參閱https://docs.datastax.com/en/cassandra/2.0/cassandra/troubleshooting/trblshootIdleFirewall.html。這幫助我解決了這個問題。

+0

我從這個問題的開始就經歷了這一點。我有足夠的** keepalive_time **,** keepalive_probes **和** keepalive_intvl **延遲配置。所以,不可能下降。 –

+0

在這種情況下,也可能是因爲您的應用程序或其他節點已經緩存了以前存在且現在已經停用的Cassandra節點的IP。從_INFO_ logs ** 18.12.10.17:60926 **看來,似乎已被刪除,但仍嘗試連接到它。請滾動重新啓動所有節點,並且應該可以解決問題。 –

+0

** 18.12.10.17:60926 **是客戶端/開發者端IP。我們不爲一個羣集使用不同的塊IP。而且我們也做了滾動重啓。但無法找出問題出在哪裏。 –

相關問題