Smart City Analytics z Talent Alpha

Artificial Intelligence & Machine Learning

Ze względu na różnorodne zastosowania, sztuczna inteligencja staje się jednym z najważniejszych komponentów analiz związanych z tematyką Smart City.  

Client: Talent Alpha

Obszar związany z nowoczesnymi ‘cyfrowymi bliźniakami (Digital Twinszyskuje obecnie na znaczeniu, szczególnie jeśli weźmiemy pod uwagę możliwości rozwoju oferowane przez postęp w sektorze technologicznym związanym z Big Data. 

Gromadzenie dużej ilości danych jest łatwiejsze i bardziej wydajne niż kiedykolwiek, a naukowcy prześcigają się w wymyślaniu coraz lepszych sposobów na używanie danych tak, żeby przynosiły one jak największą korzyść. 

Kiedy już przeanalizujemy trendy, które pojawiały się w przeszłości, oraz zrozumiemy, w jakim miejscu jesteśmy teraz, możemy skupić się na tym, co przed nami. To właśnie tu analityka predykcyjna oparta o uczenie maszynowe jest niezastąpiona.  

Jak używać Smart City Analytics w praktyce? 

Kiedy nasz klient poprosił nas o wsparcie w obszarze AI, pracował już nad ‘cyfrowym bliźniakiem’ jednego z największych miast na świecie.  

Wspólnie skupiliśmy się na rozszerzeniu opracowanego przez nich systemu o zdolności predykcyjne. Zbadaliśmy dwa główne przypadki użycia powiązane z transportem publicznym - przewidywanie liczby pasażerów oraz modelowanie czasu przyjazdów autobusów, w tym ich opóźnie 

W pierwszej kolejności przeprowadzona została przez nas szczegółowdiagnostyka dostępnych danych. Na tej podstawie określiliśmy podstawowe ramy predykcji, którą chcemy przeprowadzić – jej ramy czasowe, granularnośćinformacje dostępności i potrzebie dodania zewnętrznych źródeł danych. Wszystkie kroki odbywały się z mając na uwadze możliwość połączenia gotowego rozwiązania z istniejącym backendem 

Po uwzględnieniu wszystkich zebranych informacji, stworzyliśmy modele predykcyjne dostosowane do każdego z przypadków użycia, które pozwalają na przewidywanie: 

  • Przyszłej liczby pasażerów autobusów na podstawie danych z kart miejskich z biletami okresowymi 
  • czasu przyjazdów autobusów na dany przystanek przy użyciu aktualizowanych danych dot. przemieszczania się autobusów.  

W czasie tego procesu, przetestowaliśmy szereg technik modelowania - od analizy szeregów czasowych (m.in. przy użyciu modelProphet opracowanego przez Facebooka) aż po zaawansowane modeluczenia maszynowego (m.in. XGBoost, MLP).  

Końcowym produktem tego proof-of-concept jest model uczenia maszynowego przewidujący liczbę pasażerów, którzy wsiądą do autobusów na danym przystanku przeciągu następnych 15 minut. Opracowany model działał ok. 18 p.p. lepiej niż podstawowy model (trend historyczny). 

W celu zamodelowania czasu przyjazdu autobusów, konieczne było stworzeni potoku danych, zaczynając od gromadzenia danych w czasie rzeczywistym, oczyszczania ich oraz aplikowania spersonalizowanego algorytmu, który pozwala na grupowanie odpowiednich obserwacji w przejazdy autobusów. 

Mimo ograniczonej ilości danych, dokładność modelu przewidującego czas przyjazdu autobusów była bardzo zbliżona do wskazań systemu GPS, którego estymacje były wyświetlane na przystankach. Zbudowany przez nas model osiągał większą dokładność, kiedy odległość między autobusem a przystankiem była większa. 

Dodatkowo, klient otrzymał stworzone przez nas szczegółowe analizy powiązane z dwoma głównymi zastosowaniami. Stworzyliśmy zestaw notatników (Jupyter Notebooks) z interaktywnymi wizualizacjami, które mogą posłużyć jako narzędzie do badania oraz rozwiązywania problemów w transporcie publicznym.  

Poza modelowaniem przewidywanej liczby pasażerów oraz czasu przyjazdów autobusów, skupiliśmy się też na predykcji anomalii przy użyciu metody modelu Isolation Forest. Odkryliśmy w ten sposób, że jesteśmy w stanie – z bardzo dużą dokładnością - przewidzieć anomalie w czasie przyjazdu autobusów na podstawie danych historycznych (liczba pasażerów w ostatnich 15, 30, 45 i 60 minutach). 

Podsumowując, wykorzystując najnowsze techniki związanych ze sztuczną inteligencją udało nam się wzbogacić i udoskonalić cyfrowego bliźniaka dla współczesnego smart miasta. 

Użyte technologiePython (Jupyter Notebook, PyCharm), Git, Prophet, XGBoost, MLP 

Użyte metodologie: Data Analysis, Predictive modeling, Machine Learning, Time Series Analysis, Data Visualization, Outlier Detection, Linear Regression, Isolation Forest