Ruimtelijke patroonanalyse

Gegevensverrijking is belangrijk. Samenwerking tussen bedrijven en onderwijs

Wat verwachten we tijdens het visualiseren van locatiegegevens door deze voor de eerste keer aan de kaart toe te voegen? Ik ben er vrijwel zeker van dat ons doel is om te ontdekken of er ruimtelijke patronen zijn: regio's met hogere en lagere intensiteit van functies, clusters en uitschieters, gemeenschappelijke richtingen, onregelmatige trajecten, gebieden met hogere of lagere waarden, etc. Zodra we patronen verkennen we zijn klaar om de significantie van functies te bepalen, voorspellende modellen te bouwen en onszelf gegevenswetenschappers te noemen.

De benaderingen die worden gebruikt om patronen te ontdekken, zijn een afzonderlijk artikel waard. Momenteel werk ik eraan en ga ik beginnen met de titel "Stop met het gebruik van heatmaps ...". Laten we ons dus voorstellen dat de onderzoeker op de hoogte is van algoritmen voor patroonanalyse en klaar is om diep in de wereld van GIS te duiken.

In dit artikel zal ik puntpatroonanalyse vermelden, de resultaten tonen van patroonanalysealgoritmen en problemen waarmee de niet-GIS-professional te maken zou krijgen, en de samenwerking beschrijven tussen bedrijfsleven en wetenschap bij het ontwikkelen van de oplossing voor de huidige software-incompetentie.

Puntpatroonanalyse. Intensiteitsclusters & uitschieters

Laten we beginnen met een eenvoudige, maar een echte case: onderzoeker heeft locaties van diefstallen (auto-ongelukken, noodoproepen, tweets, foto's, vogelnesten of beverslodges. Absoluut elk type locatiegegevens) in een stad (park , zee, land ... wat er ook gebeurt). De taak van de onderzoeker is om te onderzoeken of er ruimtelijke patronen zijn en deze van elkaar te onderscheiden. Hij of zij heeft het raster opgebouwd over het verspreidingsgebied met behulp van de specifieke celgrootte om willekeur te voorkomen. Bij de volgende stap heeft de onderzoeker het aantal functies in elke cel geteld en tenslotte de Clusters & Outliers-analyse en / of Hotspots & Coldspots-analyse uitgevoerd, dit hangt af van de daadwerkelijke taak.

Bovendien heeft hij of zij NNA en Quadrat Analysis uitgevoerd, dus de onderzoeker is vrijwel zeker nu de objecten geclusterde distributie hebben en resultaten deze clusters tonen, evenals uitbijters.

Diefstallen Patroonanalyse. Screenshot van Aspectum

Ik zou zeggen dat de onderzoeker vrijwel tevreden is met het resultaat. Het is goed genoeg om uitbijters te verkennen, maar het gebied dat wordt bestreken door clusters van hoge en lage waarden is waanzinnig groot. Voor mensen die de stad kennen, ziet hoogwaardige cluster er vanzelfsprekend uit - dit zijn woon- en bedrijfsgebieden. Het cluster met lage waarden (blauwe gedeelte) komt overeen met bossen, rivieren en industriële gebieden.

Op dit moment besluit de onderzoeker om rekening te houden met stedelijke klassen bij het analyseren van de gegevens om meer nauwkeurige resultaten voor geclusterde gebieden te krijgen. Het kan helpen om clusters te vinden in vergelijkbare gebieden: de verdeling van functies binnen woongebieden gescheiden van groene of waterzones.

Stel je dus voor dat de onderzoeker het Aspectum niet heeft gebruikt en alle GIS-gerelateerde problemen heeft ondervonden: shapefiles, projecties, onhandige desktopsoftware, gebieden met distributievectorgegevens, rastergrootteformule, geschikte algoritmen via plug-ins of afzonderlijke uitbreidingen (tussen haakjes, in geval van bij Aspectum gaat het alleen om de onbewerkte gegevens).

Nu moet hij of zij de vectorgegevensset voor stedelijke landclassificatie bouwen. Maar hoe? Waar vind je gegevens? Welke zones moeten worden onderscheiden? Wat zijn de parameters om deze zone te classificeren? Hoe dit te automatiseren voor verdere taken?

Het project. Wanneer bedrijven en onderwijs verrijken

Wij geloven dat het de taak van de softwareontwikkelingsbedrijven is om een ​​product te leveren dat een waardevol resultaat kan produceren zonder de doelgroep te leren werken. En in het geval van GIS duurt het meestal 6 jaar studeren op de middelbare school.

Aspectum besloot een project te starten om stedelijke landgebruiksgegevens te genereren voor alle nederzettingen in de wereld. Zo'n ambitieus doel werd interessant voor onze vrienden en partners van Rivne Noosphere Engineering School. Het team van studenten met software engineering, GIS, stedelijke studies achtergrond, en in de eerste plaats, passie werd georganiseerd onder toezicht van docenten.

Aangezien er geen juiste aanpak voor de taak is, zijn we begonnen ons te ontwikkelen door iteraties, waarbij we de resultaten voortdurend herzien en bespreken. Dit artikel introduceert het kernidee van de implementatie van het project en toont de resultaten die nu beschikbaar zijn voor testen.

In de volgende artikelen zullen we delen dat benaderingen zijn getest, resultaten die niet hebben gewerkt, ideeën voor verbeteringen en aanvullende functies zijn geïmplementeerd.

Het concept

Er zijn enorme open source-projecten die te maken hebben met geospatiale gegevens. Ons doel is om de gegevens en de manieren om deze te verwerken samen te voegen om de meest nauwkeurige en volledige informatie te krijgen over het bepaalde gebied in nederzettingen over de hele wereld. Voor alle duidelijkheid - we hebben niet te maken met soorten landgebruik, het gaat om het idee van gelijkenis van de invloed op de fenomenen en processen die in deze gebieden plaatsvinden. Dus omdat woonwijken in de stad absoluut anders kunnen zijn, moeten we ze verschillende klassen toewijzen. Anderzijds hebben we niet te maken met de bestemmingsaanpak - het is niet nodig om winkel- en bedrijfsruimten in één groep te combineren, en het is niet duidelijk of het zinvol is om onderwijs en medische gebieden te scheiden in termen van beïnvloeding over ruimtelijke patronen in deze gebieden.

Huidige resultaten

We testen nu de MVP-versie van het product en leveren informatie over de 4 klassen binnen een gebied van gegevensdistributie. Ga naar Aspectum, voeg uw gegevens toe en voer Urban Land Classification-analyse uit. Het kan enige tijd duren om te verwerken en we hebben nog steeds een aantal beperkingen, maar we verbeteren het algoritme voortdurend.

Bekijk de kaart met de lessen op lokaal en regionaal niveau

Klassen op lokaal en regionaal niveau. Screenshot van Aspectum

Tijdens de taak zijn er een aantal ontwikkelingen geweest die we graag delen. Neem een ​​kijkje op onze GitHub-pagina, we zijn daar voortdurend projecten aan het updaten en toevoegen. osm2geojson, onze nieuwste update, is een pure Python-oplossing voor het verwerken van OpenStreetMap-gegevens. Volg Aspectum om de volgende artikelen niet te missen.