niestabilne wifi z ESP / GG 5.x ?

Awatar użytkownika
Hrumque
Posty: 275
Rejestracja: pn cze 27, 2022 10:11 am
Lokalizacja: Opole

Nie mogę dojść o co chodzi.
Sieć wifi pozornie (od strony smarfonów, tabletów, laptopów itd) działa idealnie.
Router(y) na OpenWRT 22.03.02 - sprawdzałem 2 całkowicie różne (inne czipy wifi, inny cały hardware).
Dużo urządzeń ESP - aktywnych około 50szt obecnie.
wifi.png
wifi.png (210.8 KiB) Przejrzano 804 razy
Niebieskie okienko - ping do drukarki sieciowej po wifi. Reszta to są takie same ESP urządzenia, tuż obok siebie stojące, jedne się sypią, inne nie.

NIEKTÓRE urządzenia Supla mają niestabilne połączenie wifi.
Jedne na tyle - że widać to tylko w statystyce pingu, że kilka % zgubione pakietów. Ale działają, są po wifi responsywne, pomiary z ich termometru itp są ciągłe itd.
Niektóre - zerowy problem (zero zgubionych pakietów, albo kilka szt na całą dobę - bez znaczenia).
Inne - w zasadzie nie da się użyć z apki, ciągle zielono-czerwono-zielono-czerwona kropka, pomiar temperatury jak linia przerywana

Wszystkie są na firmware GG, część hardware to origynały Sonoff, część to Gosund SP111, dużo to wemosy itp.
Wersje firmware które się sypie - przeróżna, od v4.21.5 do v5.2.8 . Ale z tymi samymi ustawieniami, w gniazdku obok, identyczny SP111, albo dwa obok siebie Sonoff Mini - jeden przerywa ciągle, a drugi działa rewelacyjnie i nie gubi ani jednego pakietu.

Wydłubałem chyba najbardziej sypiącego się SonoffBasic-a - podpiąłem na serialu:
- nie restartuje się. Po prostu sobie stoi, a co jakiś czas wyrzuca na serial że nie może się połączyć:

Kod: Zaznacz cały

Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
No reply to registration message. Resetting connection.
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
No reply to registration message. Resetting connection.
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
No reply to registration message. Resetting connection.
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
No reply to registration message. Resetting connection.
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
No reply to registration message. Resetting connection.
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
No reply to registration message. Resetting connection.
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
Device registered (activity timeout 120 s, server version: 19, server min version: 1)
Current status: [17] Registered and ready
Lub działa jakoś ... i po pewnym czasięsię wywala:

Kod: Zaznacz cały

Current status: [10] Register in progress
Device registered (activity timeout 120 s, server version: 19, server min version: 1)
Current status: [17] Registered and ready
Changing activity timeout to 30
Activity timeout set to 30 s
TIMEOUT - lost connection with server
Current status: [6] Not connected to Supla server
Establishing NOT encrypted connection with: svr32.supla.org (port: 2015)
Connected to Supla Server
Current status: [10] Register in progress
No reply to registration message. Resetting connection.
wifi2.png
wifi2.png (72.26 KiB) Przejrzano 804 razy
(szare tło = konsola UART)

- zasilanie 3.3v jest stabilne, nie popuchły kondensatory - zasilany z zasilacza laboratoryjnego zachowuje się identycznie (źle), na zasilaniu - oscyloskopem nie widzę niczego nieładnego typu szpilki od których mógłby esp się zawieszać.
- sam ESP się nie zawiesza - nawet jak gubi prawie wszystkie pingi - to konsola UART działa idealnie cały czas
- zmiana firmware z 4.22.x (dawno go robiłem) na (najnowszy 5.2.8) - NIC nie zmieniła.
- siła sygnału jest super (na serial wyrzuca Signal strength (RSSI): -27 dBm a po stronie routera -22/-79 dBm - jest metr od routera/ap wifi) , i nie widzę disconect wifi ani na chwilę (choć ping ginie).
- powiedziałbym że wifi do kitu, ale równocześnie dobre >20szt identycznych np Gosundów z tą samą wersją firmware - działa idealnie, ani jednego pakietu nie zgubi.

Jak z tym walczyć, co z tym robić, bo taka nieprzewidywalna niefunkcjonalność niektórych modułów powoduje brak zaufania do całego systemu!
Awatar użytkownika
klew
Posty: 8184
Rejestracja: czw cze 27, 2019 12:16 pm
Lokalizacja: Wrocław

Różne rzeczy mogą być nie tak.

Ja bym zaczął od sprawdzenia tego najbardziej problematycznego urządzenie na wifi z telefonu. Najlepiej przy wyłączonych urządzeniach obok.
Dalej bym odpalił jakiegoś sniffera i sprawdził jakie pakiety lecą od i do urządzenia.
Widzimy się na Supla Offline Party vol. 2 :!:
krycha88
Posty: 5187
Rejestracja: pt lis 16, 2018 7:25 am
Kontakt:

Wgraj najnowszą wersję "5.2.10" na problematyczne urządzenie i daj znać czy coś się zmieniło.
https://gui-generic-builder.supla.io/
Awatar użytkownika
Basmar
Posty: 378
Rejestracja: pt wrz 09, 2022 10:53 am
Lokalizacja: Irlandia
Kontakt:

Może skaczą pomiędzy B/G/N

Może szerokość kanału jest problemem?

Zmienić szerokość na 20 MHz przełaczyc AP na b/g only
Zmeinić kanał, przelecieć po kanałach, sprawdzić czy drukarki i inne cuda nie nadają na tej samej częstotliwości (kanale WiFi)
No i cały plan spalił na panewce :cry:
Awatar użytkownika
Hrumque
Posty: 275
Rejestracja: pn cze 27, 2022 10:11 am
Lokalizacja: Opole

krycha88 pisze: czw gru 08, 2022 9:09 pm Wgraj najnowszą wersję "5.2.10" na problematyczne urządzenie i daj znać czy coś się zmieniło.
Wgrałem 5.2.10 - zero zmian, tak samo źle. Więc poszedłem dalej:
klew pisze: czw gru 08, 2022 8:44 pm Ja bym zaczął od sprawdzenia tego najbardziej problematycznego urządzenie na wifi z telefonu. Najlepiej przy wyłączonych urządzeniach obok. Dalej bym odpalił jakiegoś sniffera i sprawdził jakie pakiety lecą od i do urządzenia.
Wyczyściłem flash, wgrałem czysty skecz, rozgłasza wifi Supla GG - połączyłem się po wifi z nią (z komputera, nie telefonu) i puściłem ping na 192.168.4.1 - tak samo gubi się co chwila! Snifferem to się już nie bawiłem, nie mam nic mądrego (a karta wifi w moim kompie nawet nie wiem czy umie w promisculus mode)
Ok, pierwsza moja myśl "oryginał sonoff, a padł... trudno" - układ odpiąłem, wrzuciłem do kartonu...

W tym czasie nie zauważyłem że nadal leci na drugim kompie ping do pozostałych urządzeń, nie zatrzymałem.
CIEKAWOSTKA -po wyłączeniu tego najgorszego Sonoffa Basica - pozostałe pingi się trochę uspokoiły! Czyżby on zakłócał sieć?
Nie ma tak, że całkowicie nie gubi - ale nie gubi, aż tak dużo, bo już nie ma urządzeń co gubią 20-30%, na wielu jest stabilne 2-3% zgubionych pakietów - aż chciałoby się wstawić "not great, not terrible".
wifi3.png
wifi3.png (147.95 KiB) Przejrzano 743 razy
No ale ... dlaczego równocześnie na części urządzeń, m.in. też identyczne sonoff Basic-e, podłączonych do tego samego AP, z tym samym firmware (też wgrałem 5.2.10) - jest równo 0% zgubionych pakietów?
Basmar pisze: czw gru 08, 2022 9:14 pm Może skaczą pomiędzy B/G/N
Może szerokość kanału jest problemem?
Zmienić szerokość na 20 MHz przełaczyc AP na b/g only
Zmeinić kanał, przelecieć po kanałach, sprawdzić czy drukarki i inne cuda nie nadają na tej samej częstotliwości (kanale WiFi)
Na routerach (bo mam 3 w sieci 802.11r Fast Transition) jest na stałe ustawiona szerokość kanału 20MHz. W miarę puste otoczenie w wifi-skanerze - tylko moje kanały, o dobre 20dB mocniejsze niż wszystkie sieci w otoczeniu. Drukarki itp sprzety - wszystkie łączą się do tego samego ssid/wifi - nie ma że "nadają swoją sieć" na innym/pokrywającym się kanale.

Tak mi przyszło do głowy - przełączyłem w AP (w związku z Fast Transition i roamingiem) "FT over Air" na "FT over DS" i obserwuję pinga. Też mam wrażenie że to porawiło (teraz tylko 1% strat) - ale nadal nie wyjaśnia to, czemu jedne urządzenie gubi ciągle coś, a drugie zupełnie nic - nawet jak są tuż obok siebie (dwa np. SP111 w jednym podwójnym gniazdku - zamieniłem je miejscami, ale nadal jeden i ten sam gubi pakiety).
Puszczam pingi na noc i zobaczymy dłuższą statystykę...
Awatar użytkownika
Basmar
Posty: 378
Rejestracja: pt wrz 09, 2022 10:53 am
Lokalizacja: Irlandia
Kontakt:

Skoro masz 3 AP na tym samym SSID, na jakich kanałach nadajesz?
Jakiej firmy masz AP?
Ja mam 3 szt Unifi i raz na jakiś czas muszę walnąć reboot na AP bo 1 lub 2 Sonoffy nie chcą gadac z WiFi.
Zazwyczaj raz na kilka tygodni/miesięcy rebootuje Wszystkie AP i po sprawie.
Każdy AP jest oddzielony od siebie co naj mnie 4 kanałami
USG sam wybiera kanały tak żeby się nie nakładały na siebie
No i cały plan spalił na panewce :cry:
Awatar użytkownika
Hrumque
Posty: 275
Rejestracja: pn cze 27, 2022 10:11 am
Lokalizacja: Opole

Basmar pisze: czw gru 08, 2022 10:35 pm Skoro masz 3 AP na tym samym SSID, na jakich kanałach nadajesz?
Jakiej firmy masz AP?
Ja mam 3 szt Unifi i raz na jakiś czas muszę walnąć reboot na AP bo 1 lub 2 Sonoffy nie chcą gadac z WiFi.
Zazwyczaj raz na kilka tygodni/miesięcy rebootuje Wszystkie AP i po sprawie.
Każdy AP jest oddzielony od siebie co naj mnie 4 kanałami
USG sam wybiera kanały tak żeby się nie nakładały na siebie
Routery różne - akurat dwa firmy Glinet (chińczyk, ale dobry raczej - robi sprzęt wprost pod openwrt dedykowany), jeden DLink.
Atheros QCA9560 802.11bgn
Atheros AR9223 802.11bgn
Atheros AR9331 802.11bgn

Kanały są ustawione tak, że jest A = ch1 potem na drugim końcu domu B = ch10, oraz w najdalszej lokalizacji (piwnica)C = ch4. W lokalizacji A nie widać (ani na skanerze, ani nie znajduje, gdy wyłączę lokalnie A) sieci z punktu C i nawzajem.

Tutaj nic nigdy nie musiałem restartować - gdyby nie Supla to bym powiedział że 100% działa, telefony przenoszą się między punktami zupełnie bezboleśnie i niewidzialnie - nie zauważysz kiedy się przelogowało między AP.
Awatar użytkownika
Basmar
Posty: 378
Rejestracja: pt wrz 09, 2022 10:53 am
Lokalizacja: Irlandia
Kontakt:

W takim razie polecam młotek 5-cio kilowy jako forma terapii dla Sonoff i wymianę hardware.
Pewnie moduły WiFi się grzeją albo coś w tym stylu. Nie widzę innej opcji.
WiFi nie lubi ciepła. Jak masz termowizje lub kamerę flir to poobserwój i porównaj ciepło z dobrze pracującym Sonoff and tym co gubi pakiety.
Nie widzę innej przyczyny.
No i cały plan spalił na panewce :cry:
Awatar użytkownika
Hrumque
Posty: 275
Rejestracja: pn cze 27, 2022 10:11 am
Lokalizacja: Opole

Statystyka kilku modułów po ~24h:
4 moduły sonoff basic,
2 moduły sonoff basic r3
1 moduł sonoff 4CH
2 moduły Gosund SP111
wszędzie prawie równo 3% - zastanawiające...

Kod: Zaznacz cały

Ping statistics for 192.168.1.62:
    Packets: Sent = 66847, Received = 64515, Lost = 2332 (3% loss),
Approximate round trip times in milli-seconds:
    Minimum = 1ms, Maximum = 138ms, Average = 2ms

Kod: Zaznacz cały

Ping statistics for 192.168.1.70:
    Packets: Sent = 66753, Received = 64396, Lost = 2357 (3% loss),
Approximate round trip times in milli-seconds:
    Minimum = 1ms, Maximum = 167ms, Average = 2ms
itp.

Do tego znalazłem kolejne moduły 2 Sonoff Basic gubiące dramatycznie:

Kod: Zaznacz cały

Ping statistics for 192.168.1.65:
    Packets: Sent = 365, Received = 170, Lost = 195 (53% loss),
Approximate round trip times in milli-seconds:
    Minimum = 1ms, Maximum = 1209ms, Average = 35ms
ALE:
10 modułów opartych o DYI (jakieś wemosy, esp01, szajs wszelaki lepiony z czego popadnie), 6 modułów SP111, oraz kilka Sonoff mini i basic (żeby nie było, że sonoff taki zły) - 0% pingów zgubionych.
Liczbowo - np 4szt zgubione (w ciągu 24h) na 75661szt wysłane - to jest zero ;)
Dla testów - wyłączyłem wszystkie AP wifi poza jednym głównym (do którego większość modułów ma zasięg) - pologowały się wszystkie na jeden AP, niektóre z słabym zasięgiem - ale ok..

No po prostu nie mogę ogarnąć co się dzieje w tej sieci!

O ile mógłbym podejrzewać, że niektóre Sonoff Basic są zrąbane... Ale nawet jak je wyłączyłem, to zastanawiające jest to, że dziury w pingu do wielu modułow są synchroniczne. W tym samym czasie, z poziomu tego samego AP ping ginie (1-2 sztuki) do kilku modułow, ale pozostałe równocześnie odpowiadają bez zarzutu.
wifi24.png
wifi24.png (251.94 KiB) Przejrzano 664 razy
Więc mógłbym podejrzewać że winny jest router/ap/sieć - przeniosłem drugi w miejsce pierwszego, A wyłączyłem, B włączyłem, połączyły się esp do drugiego AP - i sytuacja jest identyczna, nic się nie zmieniło
krycha88
Posty: 5187
Rejestracja: pt lis 16, 2018 7:25 am
Kontakt:

A może na tych urządzeniach masz dodany jakiś sensor który blokuje ESP na czas odczytu?
https://gui-generic-builder.supla.io/
ODPOWIEDZ

Wróć do „Ogólna dyskusja”