Gdzieś między Polską a Niemcami, a szczególnie w NRD

Czas nieutracony (12) – Wątki

Dziś będzie o multitaskingu.

Wiecie, ja na codzień robię te systemy AUTOSARowe. Tam chodzi podręcznikowy multitasking plus przerwania, dokładnie jak napisane w książkach o systemach operacyjnych - z priorytetami tasków, wywłaszczaniem (lub nie), eventami do tasków, różnymi mechanizmami synchronizacji, schedule table, hookami itp. itd. I to wszystko jest mniej lub bardziej ręcznie konfigurowane, a system operacyjny jest w źródłach i można sprawdzić, zdebuggować, a nawet zmodyfikować dowolny szczegół (przy modyfikacji pamiętając, że dostawca OSa wykręci się wtedy od jakiejkolwiek odpowiedzialności za cokolwiek, nawet w zupełnie innym miejscu). Zajmuję się też robieniem ochrony pamięci przy pomocy MPU, znaczy to ja określam co i kiedy w rejestry tego MPU ma się wpisywać (bo standardowa obsługa w AUTOSARze jest marnie wymyślona, żeby działało jak trzeba trzeba to zrobić po swojemu, głęboko ingerując w system).  I zajmuję się problematyką różnych call contextów, żeby się nie mieszało. I robię też obsługę wyjątków oraz integrację coretestów. Większość tego (poza MPU) nie należy do zakresu moich obowiązków, ale co pewien czas jestem wołany do pomocy w gaszeniu, jak coś się pali. Czyli mam o tym  pojęcie, aż do najniższego poziomu, nawet pojedynczych instrukcji procesora (a nawet całkiem różnych procesorów, bo co projekt to inny core, inny zestaw instrukcji, inne MPU, inna koncepcja wyjątków, ...).

No i teraz zajmuję się tym moim programem pod Windowsy. Enterprise Architect jest bardzo stary, w momencie gdy powstawał, procesory pecetowe miały zazwyczaj tylko jednego cora, więc nic dziwnego że on cały chodzi w jednym threadzie. Ja dokładam do niego plugina który robi sporo niezależnych rzeczy, więc można by spróbować to czy tamto puścić w nim w innych threadach, żeby szybciej było. Tu i ówdzie mi się udało, ale ciągle mam poważny problem: Ja za cholerę nie rozumiem, jak działa threading w Windowsach/.NET! Wielokrotnie próbowałem o tym poczytać, ale nigdzie nie ma porządnego opisu podstaw z jakimiś paroma rysunkami, znajduję tylko całe strony jakiegoś blablabla TL;DR który "wyjaśnia" jak technicznie z tym działać, ale nie odpowiada na moje całkiem podstawowe i zasadnicze pytania.

Bo sytuacja jest taka: Chodzi sobie ten EA, i przez COM ładuje mojego plugina. I EA wywołuje, też przez COM, jakieś funkcje w moim pluginie, one coś robią. Tu jest jasne, to jest ciągle ten sam thread. Ale dalej, zmiany które zrobiłem w danych elementów dialogowych są jakimś cudem wyrysowywane na ekranie, ma to być podobno GUI thread. No i jaka jest relacja tego GUI threada do tego głównego threada? Z obserwacji wynika, że one chodzą na tym samym corze, ale jak są schedulowane?

Niedawna walka: Mam ja taki sobie splash screen pokazywany przy starcie EA, to jest zwyczajne okienko otwierane i zamykane podczas startu EA, wszystko w obrębie funkcji obsługującej jeden event EA. Na początek włożyłem mu w tło obrazek, i wszystko działało zgodnie z oczekiwaniami. Potem stwierdziłem, że na tym splashu wypiszę numer wersji mojego plugina. Postawiłem na nim labela, wpisałem do niego z kodu numer wersji, puściłem - i zamiast ładnego napisu dostałem biały prostokąt. Po kilku próbach poustawiania różnych propertiesów dałem spokój, i zrobiłem to samo z edit boxem. Tu było trochę lepiej - mój tekst się pojawił, ale zaselektowany. Ale tak nie może przecież być, żebym miał mocno niebieskie tło do tych kilku liter. No to podstawiłem w jakimś evencie SelectionLength=0 - nie zadziałało. To w innym evencie - też nie. Jeszcze paru - nadal nic. Sprawdziłem - żaden z tych eventów nie był wywoływany. Tu mi zaczęło świtać: Jestem w obsłudze eventu, więc nie jest wołany GUI Thread i controle nie są rysowane. No i co w tym momencie zrobić? Na koniec poradziłem sobie wywalając controle i rysując mój numer wersji po prostu na załadowanym do pamięci obrazku, jeszcze przed otwarciem okna. Ale moje pytania nadal pozostały bez odpowiedzi.

A potem dochodzi następny stopień trudności: Puszczam sobie explicite nowy thread, ale chciałbym pokazywać jak mu idzie w pasku postępu w GUI. No i jakie są relacje między tymi wszystkimi threadami? Pasek postępu zatrzymuje się co i raz, dlaczego dokładnie i jak to poprawić? Nikt nic na ten temat nie wie.

Jak już przy tym jesteśmy, to jeszcze opowiem anegdotę o guru Beelekensie - drugi raz, kiedy zajrzałem do jego kodu, był właśnie przy threadach. No i zobaczyłem tam jego komentarze, że miał problemy, ale zrobił jakieś workaroundy i już gubi eventy najwyżej z pięć razy na dzień pracy. Zainteresowało mnie to, i skopiowałem jego rozwiązanie do siebie. Gubiło tak gdzieś ze trzy eventy na dziesięć, śmiech na sali. Gdzie ma problem, zauważyłem już przy kopiowaniu - błąd było widać na pierwszy rzut oka. Poprawiłem, usunąłem workaround i poszło bez zarzutu. Uśmiejecie się, jak napiszę, co to było: On miał kolejkę na eventy pomiędzy threadami, i użył do tego klasy Queue, bez żadnej ochrony. Poprawka polegała na użyciu specjalnie do takiego celu przeznaczonej klasy ConcurrentQueue. I tyle. Nie trzeba wiele, żeby być guru w niszy.

(Wyjaśnienie dla mniej kumatych w tej działce: Tu mamy kolejkę eventów między threadami. Z jednej strony dodaje się event w jednym threadzie, z drugiej wyjmuje się go w innym. Teraz problem polega na tym, że jeżeli w trakcie dodawania obiektu thready zostaną przełączone i drugi thread wyjmie element zanim wszystkie zmienne zostaną zaktualizowane po stronie pierwszego, to kolejka może nam się pomieszać i coś zginie. Trzeba więc zapewnić, żeby operacje dodawania i wyjmowania były nieprzerywalne (atomowe) - i to właśnie zapewnia klasa ConcurrentQueue) .

W sumie brak specyfikacji jak działają taski/thready to jest problem nie tylko Windowsów. Na przykład dawno temu kupiłem synowi Lego Mindstorms, te wczesne, z żółtym brickiem. Programowało się to wizualnie przy użyciu programu o nazwie RCX Code, w sumie koncepcja była zbliżona do typowych flowchartów albo UMLowych activity diagramów.

Nie wkleję własnego screenshota z programu, bo ten system też był bardzo twitowy - chodził tylko na Windows 98 i tylko w rozdzielczości bodajże 800x600. Ta rozdzielczość była hardcoded i dla visual programming była o wiele zbyt mała. Dziś dałoby się to ewentualnie puścić na maszynie wirtualnej z Win98, ale przy tych 800x600 to i tak byłaby jedna wielka męka, więc nie warto.  Jeżeli ktoś chciałby się w tego RCXa bawić, to opracowano do tego support dla różnych "normalnych" języków programowania, nie trzeba używać akurat tego RCX Code.

RCX Code

RCX Code, Źródło

Zrobiony graficznie kod reagował na zdarzenia zewnętrzne, oprócz głównego threadu można było też wyklikać kod dla obsługi eventów od różnych wejść albo timera (jak widać na obrazku wyżej). I tu też żeby zrobić coś porządnie wypadałoby wiedzieć, jak to wszystko dokładnie działa - interrupt? polling? jak schedulowany?, czyli dokładnie te same pytania co w Windowsach. W dokumentacji LEGO nic na ten temat nie było.

-----------------------------------------------------------------------------------------------------------------------

Dotyczy:

Kategorie:Programowanie

Sledz donosy: RSS 2.0

Wasz znak: trackback

-----------------------------------------------------------------------------------------------------------------------


6 komentarzy do “Czas nieutracony (12) – Wątki”

  1. charliebravo pisze:

    Wiesz co, organ nieużywany ulega zanikowi, ale 10 lat temu ja te rzeczy ogarniałem dosyć dobrze, mogę spróbować pomóc. Na razie piszesz na dużym poziomie ogólności, ale:
    1) Wątki COMa. ZTCP to zależy od containera do którego ten obiekt ładujesz. Guglaj COM apartment threading, com threading model. To można konfigurować, _wydaje_ mi się że można na przykład wymusić wykonanie w wątku wołającego COM (single threaded model).

    2) „Mój wątek nie rysuje poprawnie”. A to akurat jest dość proste i spoko działa. Większość znanych mi systemów okienkowych ma jeden wątek GUI i tyle. Ale Windows ma inaczej, i co śmieszniejsze, to jest nieźle zrobione. Otóż na Windowsach KAŻDY wątek może robić GUI, ale żeby to działało, to musisz w tym wątku mieć message loop. Czyli na najprostszym poziomie jak to. Oczywiście wątek może też robić inne rzeczy, ale jeśli nie będzie okresowo wracał i kręcił korbką w message loop, to nie spodziewaj się działania grafiki. Część rzeczy „działa”, bo ZTCP okno da się utworzyć, i dlatego COŚ Ci się pojawiło (system wie że tam jest okno i bodaj na tło częściowo to wpływa) ale kontrolka Ci się nie narysuje bo to wisi na WM_PAINT a Ty tego nie dostarczasz.

    Dalej, jak już się ma w wątkach windowsowych te message loopy to całkiem wygodnym mechanizmem do komunikacji między wątkami są własne zdefiniowane message’y, bo każdy wątek z może wysłać WM_something do każdego wątku z message loopem, i może to robić synchronicznie albo asynchronicznie (PostMessage vs SendMessage). Na chama można do tego użyć WM_USER, elegancko jest sobie zrobić własny przy użyciu RegisterWindowMessage. Każdy message „nosi” ze sobą argumenty (te wParam/lParam), więc można sobie na przykład wprowadzić konwencję że wParam to adres na obiekt klasy Command, z wirtualną metodą execute(), i zrobić wysyłanie komunikatów raz a potem tylko dodawać eleganckie klasy w C++ do nowej funkcjonalności.

    Aha, I w Windowsach zwykle wiele można ogarnąć debuggerem, wstaw sobie breakpointy do swoich procedur, a potem zobacz na jakim wątku się to woła. To szczególnie pomaga przy ogarnianiu skąd lecą rzeczy COMowe.

    • cmos pisze:

      Twoja odpowiedź jest dokładną ilustracją problemu, o którym piszę: Ja się pytam o opis koncepcji na podstawowym poziomie, a ty odpowiadasz „W sytuacji X zrób A, a jak nie idzie podebugguj”.
      Sam wiem, że mogę ręcznie wetknąć message loop itp. tricki, ale nie zbliża mnie to specjalnie do faktycznego zrozumienia działania systemu.

      • charliebravo pisze:

        Twoja odpowiedź jest z kolei ilustracją innego problemu: mianowicie, Tobie się najwyraźniej wydaje że to jest gdzieś w ogóle opisane (!) i jeszcze w przystępny sposób (!!).

        Nie jest. Ludzie nieźle ogarniający zwykle dochodzili do wiedzy „siedząc” odpowiednio długo w Windowsach, i ucząc się warstw po kolei. Np najpierw programując w gołym Win32 API, potem dodając do tego MFC czy inne ActiveX. I czytając w kółko MSDNa (ja zaczynałem jak jeszcze był na płytach CD)

        Każdy z tych tematów jest sam w sobie trudny, a na ich styku dochodzi do rzeczy jeżących włos na głowie. Na ogół _nic_ nie jest opisane, pewne zrozumienie dawało się wyciągnąć z debuggera (np źródła do części MFC były dołączane do VS, więc można było zobaczyć jaka asercja strzela albo na jaki call do Afx się wywala).

        Na dodatek, Ty nie piszesz od zera softu, który ma „tylko” wszystkie te rzeczy wykorzystać (pytanie po co, ale to inne pytanie), tylko wchodzisz w kod Enterprise Architekta, który dodaje na szczycie swoje patenty. I pewnie do tego też chciałbyś mieć dobrą dokumentację??

        • cmos pisze:

          Chyba nie przeczytałeś notki – ona jest dokładnie o tym. Żeby zrobić porządny produkt z użyciem jakiegoś frameworku czy czegoś takiego, muszę wiedzieć jak on działa. Akurat u MS to zawsze musi być ciężka walka o zrozumienie, bo oni sami nie ogarniają tego, co robią, ale inni też nie są bez winy.

          • charliebravo pisze:

            „Chyba nie przeczytałeś notki”
            Przeczytałem notkę, w której widać że masz problemy z podstawami (prawda że trudno dostępnej wiedzy). Więc wskazuję Ci konkretnie, gdzie leżał jeden z problemów – żeby kontrolki GUI działały w jakimś wątku, ten wątek musi mieć message loopa. To akurat jest reguła i jest dobrze opisane w dokumentacji.

            Tak, to jest trudny temat. Tak, nie ma żadnego dobrego ogólnego opisu. Powodzenia, baw się dobrze!

  2. Avatar photo boni pisze:

    O, jaki mam przez ciebie blast form the past!

    Pomóc nie pomogę, ale do pośmiacia: jakoś tak w okolicach mezospecularium Windowsa 7, miałem fazę „no w końcu muszę się nauczyć tego całego multithreadingu na zylionie cores, bo to przyszłość i fogle”. Ale nie chciało mi się uczyć na pracowych/zarobkowych rzeczach, ino na jakichś grach i zabawach, np. jakieś tam wprawki do gierek, w stylu: na froncie jakaś grafa + od zaplecza serwerek + dla 8 czy 16 graczy po www, z full-security. No aż się prosiło, żeby to puścić w paru różnych wątkach, co nie.

    No więc pierwsze w miarę kompletne próby, jak już z tych wszystkich KB, MFC i innych przykładów skleciłem cokolwiek, wybuchły mi Windowsa 7 do bluskrina parę razy (a nie wybuchło go nigdy nic, nawet bardzo dziwne i zabytkowe narzędzia do przemysłu itp.).

    Potem spędziłem jeszcze drugie tyle czasu na debugowaniu, ulepszaniu, wyczytywaniu następnych kB wiedzy z KB, i mocno ulepszyłem ten mój multithreading – wybuchał Windowsa 7 tak sprawnie, że nawet bluskrina nie zdążał pokazać, ani logów i dumpów zrzucić, tylko JEB i resecik.

    Na tym moje przygody z tematem się zakończyły. To nie był mulithread, to jakiś multithreat.

    BTW bardzo poważna uniwersalna SCADA dla bardzo poważnych zastosowań (hint: Big Pharma), w której siedzę ostatnimi laty, nadal jest „w sercu” jednowątkowa i 32 bitowa. „I nikt nie narzekał”, chociaż w 2021 niektórzy już trochę narzekają 😉

Skomentuj i Ty

Komentowanie tylko dla zarejestrowanych i zalogowanych użytkowników. Podziękowania proszę kierować do spamerów