Satellogic Inc. hat die Freigabe eines großen offenen Datensatzes mit hochauflösenden Bildern aus dem Archiv des Unternehmens bekannt gegeben, um das Training von KI-Modellen zu unterstützen. Der Datensatz enthält rund 3 Millionen Satellogic-Bilder von einzigartigen Orten - 6 Millionen Bilder, einschließlich der Wiederholungen von Orten - aus der ganzen Welt. Jedes Bild hat eine Größe von 384 x 384 Pixeln, insgesamt also 900 Gigapixel, die verschiedene Landnutzungsarten, Objekte, Geografien und Jahreszeiten abdecken.

Der vollständige Datensatz kann auf Hugging Face abgerufen werden. Die Satellogic-Daten werden unter einer Creative Commons CC-BY 4.0-Lizenz veröffentlicht, die eine kommerzielle Nutzung der Daten mit Quellenangabe erlaubt. Ein Artikel, der den Datensatz vorstellt, wird zusammen mit der Veröffentlichung eines Basismodells, einem maskierten Autoencoder (skalierbarer selbstüberwachter Lerner für Computer Vision), der darauf aufbaut, veröffentlicht werden.

Das Papier beschreibt den Aufbau des Datensatzes, die Modellarchitektur und den experimentellen Aufbau. Diese Arbeit ist das Ergebnis der Zusammenarbeit von Satellogic mit einem außergewöhnlichen Team von Forschern unter der Leitung von Alexandre Lacoste bei ServiceNow und unter der Führung von Yoshua Bengio.