De 12urenloop is een jaarlijkse loopwedstrijd aan de Universiteit Gent. De deelnemende studentenverenigingen lopen in een estafetterace die 12 uur duurt zoveel mogelijk rondjes. Elk team krijgt één baton (doorgeefstok) toegekend, dus ze kunnen maar één loper tegelijk hebben.

Zeus doet al even het tellen op de 12urenloop: eerst via een manueel telsysteem waarbij de rugnummers van de lopers worden ingegeven, dan vanaf 2011 met een automatisch telsysteem dat werkt via bluetooth-modules in de batons. Voor de rest van de context qua de historische hardware en software kan je de blogpost uit 2011 lezen.

Het oude telsysteem had een aantal issues:

De gyrids (de computers die rond het circuit opgesteld waren en de bluetooth-beacons opvingen) begonnen vrij oud te worden en gingen kapot
De gyrids pollden welke Bluetooth devices er in de buurt waren, waarna de batons antwoordden. De detecties van batons was niet betrouwbaar, en de betrouwbaarheid daalde jaar na jaar, waarschijnlijk doordat er steeds meer mensen Bluetooth devices bijhadden.
Niemand van de huidige generatie leden in Zeus begrijpt het telprogramma count-von-count echt (het is geschreven in Haskell op de manier waarop je Haskell moet schrijven), wat het lastig maakt om features toe te voegen of als er iets mis loopt tijdens het event te debuggen.
…

Om bovenstaande redenen hebben we in 2019, na een editie waarbij we volledig op manualcount hebben moeten draaien, beslist om zowel de hardware als de software te vervangen: count-von-count wordt vervangen door Telraam, de gyrids door Raspberry Pi’s en de bluetooth modules in de batons door Bluetooth Low Energy (BLE) microcontrollers die we zelf kunnen programmeren.

De hardware

Batons

De batons bevatten een Adafruit Feather nRF52 Bluefruit LE microcontroller en een herlaadbare lithium-ion batterij. Ze zijn geprogrammeerd om 10 keer per seconde een beacon-pakketje te sturen waarin het batterijpercentage en de uptime zitten: op die manier kunnen we monitoren of er batons zijn waarvan de batterij bijna plat is. Via de uptime kunnen we detecteren of de batons rebootten tijdens het event.

Er zijn twee belangrijke voordelen bij deze microcontrollers ten opzichte van de vorige ‘domme’ bluetooth-chips: ten eerste kunnen we zelf programmeren wat de microcontrollers sturen in de beacon-pakketjes. Hierdoor kunnen we telemetry meegeven zoals batterijpercentage en uptime. Ten tweede sturen de microcontrollers nu zelf heel frequent hun beacon-pakket, zonder dat deze gepolld moeten worden. Dit zorgt ervoor dat de detectierate van batons een stuk naar boven gaat.

Inhoud van de batons

Stations

Er staan verschillende dozen rond het loopcircuit. In elke doos zit een Raspberry Pi, een kleine netwerkswitch, een autobatterij en twee spanningsomvormers (voor de networkswitch en de Pi). Het geheel van die hardware wordt een station genoemd (intussen is de term “Ronny” ook wel populair geworden). De stations zijn onderling via ethernetkabels verbonden. De ethernetkabels gaan het parcours rond in een lus. In de IT-container komen dus twee ethernetkabels toe. Hiervan pluggen we er maar één in de core-netwerkswitch. De andere kabel ligt er, zodat als een kabel in de lus kapot gaat (doordat er bijvoorbeeld een koets over rijdt), we gewoon die reservekabel moeten insteken in de switch in de container om onze stations terug netwerkconnectiviteit te geven.

De Raspberry Pi’s in de stations luisteren naar de beacon-pakketjes die uitgestuurd worden door de batons en slaan de informatie uit de ontvangen pakketten op in een lokale database:

MAC-adres van de baton
RSSI (signaalsterkte, dit komt kort door de bocht overeen met de afstand van de baton tot het station)
uptime en batterijpercentage van de baton
Unix timestamp waarop het pakket ontvangen is
het ID van de detectie (een getal dat strikt stijgt, per station)

Vroeger stuurden de Gyrids die gegevens dan live door naar count-von-count. Hierdoor was de setup zeer gevoelig aan netwerk- en ander falen: als er bijvoorbeeld een koets over de netwerkkabels reed (helaas is dit geen theoretisch voorbeeld) of count-von-count down was, dan gingen alle detecties verloren tot de verbinding terug hersteld werd. Dit is nu opgelost door de detecties vanaf Telraam binnen te trekken in plaats van die vanuit de stations naar Telraam te duwen: er draait een kleine webserver op elk station die een endpoint /detections/<id> heeft. Deze geeft alle detecties na het meegegeven ID terug: op die manier is het makkelijk om alle detecties naar een lokale databank in Telraam te synchroniseren. Als extra voordeel is het hiermee nu ook mogelijk om voor elk station alle detecties te downloaden. Met deze data kan het event gereplayed worden, zodat er makkelijk gesleuteld kan worden aan het algoritme in Telraam zonder telkens een fysiek test-event te moeten doen.

De spanningsomvormers (buck converters) zetten het voltage van de batterij om in 9V voor de switch en 5V voor de Raspberry Pi. Ze zijn via een JST-connector verbonden met de autobatterij, waardoor het niet meer mogelijk is om per ongeluk de polariteit om te keren. Aan een van de omvormers hangt ook een digitale spanningsmeter, waardoor het in één oogopslag duidelijk is hoeveel energie er nog in de autobatterij zit. Ter bescherming van de omvormers zijn er ook behuizingen ge-3D-print.

Op onderstaande foto kan je zien wat er allemaal in een station-doos gaat (behalve de netwerkswitch of ethernetkabels)

Inhoud van de stations

Netwerk

Ook qua netwerk zijn we er wat op vooruit gegaan: vroeger trokken we voor onze uplink een kabel van de nabijgelegen Sint-Pietersabdij naar de IT-container. De vorige editie hebben we deze kabel vervangen door een “straler” (een point-to-point Wi-Fi verbinding die zich gedraagt als een kabel). Zo moeten we de hoogtewerker niet meer gebruiken, waardoor we veel sneller kunnen opbouwen. Daarnaast hebben we nu ook een reserve-uplink: de TADAAM. Dit is een 4G router die maar €40 kost per maand voor ongelimiteerd internet aan 30 Mbps. Het is mogelijk dat we die naar de komende jaren zullen gebruiken als enige uplink.

Software

Telraam

Telraam is het nieuwe telprogramma, ter vervanging van count-von-count. Het gebruikt Viterbi als algoritme om detecties van batons te transformeren naar rondjes. We gebruiken Viterbi omdat de stations niet altijd voorbijkomende batons detecteren. Viterbi werkt aan de hand van een hidden-markov-model, waarbij de detecties de ‘events’ zijn, en de hidden state de locatie van de baton (aan welk station die dus is).

Telraam is in Java geschreven. Minder flashy dan count-von-count in Haskell, maar zo kunnen we wel garanderen dat volgende generaties ook overweg kunnen met de code: Java is de eerste taal die we zien in de opleiding.

Emmanuel Count

Emmanuel Count (manual count) is de software waarmee we tijdens de eerste uren van de wedstrijd manueel tellen (door de rugnummers van de lopers aan te tikken op een tablet). Eenmaal de automatische telling en de manuele telling lang genoeg overeenkomen, kunnen we overschakelen op de automatische telling. Dit kan vrij makkelijk in Telraam.

De manualcount frontend houdt nu zelf de rondjes bij en synct deze naar de backend, zodat het tellen kan doorgaan, ook al breekt de netwerkverbinding of is de backend down. Het is mogelijk om via meerdere toestellen tegelijk te tellen, zodat er een vlotte overgang kan gebeuren bij het wisselen van manualcount-personeel.

Manualcount screenshot

Loxsi de proxy

Loxsi de proxy (vernoemd naar @lox 🧡) is het stuk software die het aantal rondjes voor de live-site servet. Dit vraagt aan Telraam het aantal rondjes per team op, en exposet een Websockets API om die dan terug te geven. De livesite vraagt dit niet direct aan Telraam, omdat we anders bij een hoog aantal van de bezoekers mogelijk Telraam zouden overweldigen. In plaats daarvan vraagt Loxsi om de zoveel tijd aan Telraam het aantal rondjes, en geeft het dan dit gecachete aantal terug.

Monitoring

We hebben ook veel monitoring geïntroduceerd, dit geven we allemaal weer via een Grafana dashboard. We tonen onder andere het volgende:

aantal rondjes per team
status van de batons: batterijpercentage en of ze herstart zijn tijdens het event (dit is wanneer hun uptime gedaald is)
status van de stations: zijn ze nog bereikbaar over het netwerk? werkt hun HTTP-server nog? hoe lang geleden is de laatste detectie?
status van de software (telraam en manualcount)

Op onderstaande screenshot staat een (intussen lichtjes verouderde) versie van de monitoring setup.

Grafana dashboard

Evaluatie en toekomst

We hebben de vorige 12urenloop-editie het automatisch telsysteem kunnen gebruiken: we hebben enkel het eerste uur van het event manueel geteld, tot we zagen dat onze automatische telling betrouwbaar was. De rest van het evenement hebben we volledig op de automatische telling kunnen draaien. Dit was de eerste editie in lange tijd waarbij we zijn kunnen stoppen met manueel tellen; een indrukwekkende prestatie, gezien we volledig nieuwe hard- en software gebruikten, al zeg ik het zelf.

De 12urenloop-stack is nu een heel pak betrouwbaarder, nauwkeuriger en meer debugbaar; maar natuurlijk stopt ons werk daarmee niet: er is zeker nog ruimte voor innovatie. Zo zijn we momenteel al naar het volgende aan het kijken:

Momenteel worden de gewichten van het Hidden-Markov-model manueel bepaald. Ze zijn niet compleet uit de duim gezogen, maar optimaal zijn ze waarschijnlijk ook niet, wat mogelijk kan leiden tot heel sporadische gemiste rondjes, die dan manueel gecorrigeerd moeten worden. Deze gemiste rondjes zijn wel heel duidelijk detecteerbaar, maar het zou leuker zijn als de telling direct perfect is. Hiervoor is Francis in het project voor het vak Machine Learning aan het proberen om de gewichten voor de HMM automatisch te bepalen.
Er is momenteel nog geen telemetry over de batterijpercentages van de stations: er hangt wel een spanningsmeter aan de batterij, maar deze kan enkel daar afgelezen worden. Op zich is het geen harde vereiste om op afstand de batterij te kunnen monitoren, de auto-batterijen in de stations zouden lang genoeg mee moeten gaan, maar het is een makkelijke toevoeging die kan gebeuren met hardware die we al hebben.
Het trekken van netwerkkabels tussen de stations is vrij tijdsintensief en duur in materiaalkost, zeker omdat die soms niet herbruikt worden over meerdere events heen. Het zou interessant zijn om alternatieven hiervoor te evalueren, zoals bijvoorbeeld een Wi-Fi mesh-netwerk tussen de verschillende stations.

Zeus kennende, zal het zal waarschijnlijk niet bij het bovenstaande blijven. Ik kijk er al naar uit om over een vijf-tal jaar een blogpost te lezen over wat er allemaal veranderd is.

Rondjes tellen met Bluetooth Low Energy op de 12urenloop

door Jasper Devreker