Jeder, der Google Fotos ausprobiert hat, würde zustimmen, dass dieser kostenlose Speicher- und Verwaltungsdienst für Fotos von Google intelligent ist. Es bietet verschiedene intelligente Funktionen wie die erweiterte Suche, die Möglichkeit, Ihre Bilder nach Orten und Daten zu kategorisieren, automatisch Alben und Videos basierend auf Ähnlichkeiten zu erstellen und Sie in die Vergangenheit zu führen, indem Sie Fotos desselben Tages vor einigen Jahren anzeigen. Es gibt viele Dinge, die Google Fotos tun kann, die vor einigen Jahren maschinell unmöglich waren. Google Fotos ist einer der vielen "intelligenten" Dienste von Google, die a verwenden Technologie des maschinellen Lernens genannt TensorFlow. Das Wort Lernen zeigt an, dass die Technologie mit der Zeit intelligenter wird, bis zu dem Punkt, den sich unser derzeitiges Wissen nicht vorstellen kann. Aber was ist TensorFlow? Wie kann eine Maschine lernen? Was kannst du damit machen? Lass es uns herausfinden.
Was ist TensorFlow??
TensorFlow ist Googles Open Source und leistungsstark Software für künstliche Intelligenz, Dies unterstützt viele Dienste und Initiativen von Google. Es ist die zweite Generation eines Systems für umfangreiche maschinelle Lernimplementierungen, das vom Google Brain-Team entwickelt wurde. Diese Bibliothek von Algorithmen folgt DistBelief - der ersten Generation.
Die Technologie stellt die Berechnung als zustandsbehaftete Datenflussdiagramme dar. Was TensorFlow einzigartig macht, ist seine Fähigkeit, Berechnungen auf einer Vielzahl von Hardware zu modellieren, von mobilen Geräten auf Verbraucherebene bis hin zu erstklassigen Multi-GPU-Servern. Es kann auf verschiedenen GPUs und CPUs ausgeführt werden und verspricht die Skalierbarkeit des maschinellen Lernens zwischen den verschiedenen Geräten und Gadgets, ohne dass eine erhebliche Menge an Code geändert werden muss.
TensorFlow entstand aus der Notwendigkeit von Google, Anweisungen zu erteilen ein Computersystem, das die Funktionsweise eines menschlichen Gehirns nachahmt beim Lernen und Denken. Das als neuronale Netze bekannte System sollte in der Lage sein, mehrdimensionale Datenarrays auszuführen, die als "Tensoren" bezeichnet werden. Das Endziel besteht darin, die neuronalen Netze zu trainieren, um Muster und Korrelationen zu erkennen und zu entschlüsseln.
Im November 2015 hat Google diese Technologie entwickelt Open Source und erlaubte es, in alle Arten von Produkten und Forschungen übernommen zu werden. Jeder, einschließlich Forscher, Ingenieure und Bastler, kann dazu beitragen, das Wachstum des maschinellen Lernens zu beschleunigen und es in kürzerer Zeit auf ein höheres Niveau zu bringen.
Dieser Schritt erwies sich als richtig, da die unabhängigen Entwickler so viele Beiträge zu TensorFlow leisten, dass sie die Beiträge von Google bei weitem übertreffen. Wikipedia erwähnt, dass „es gibt 1500 Repositories auf GitHub, die TensorFlow erwähnen, von denen 5 von Google stammen. “ Abgesehen davon vermutet eine der Diskussionen bei Quora, dass der veröffentlichte Open-Source-Code die "bereinigte" Version von der ist, die Google in seinen Diensten verwendet.
Wie funktioniert TenserFlow??
Wenn wir die einfache normale menschliche Sprache und eine starke Vereinfachung verwenden, sehen wir möglicherweise eine Seite von TensorFlow als fortschrittliche autonome Filtertechnologie. Das Herzstück der Technologie ist eine riesige Softwarebibliothek für maschinelles Lernen. Es verwendet die Datenbank, um „Entscheidungen zu treffen“..
Beispielsweise lädt jemand ein Foto zu Google Fotos hoch. Die Technologie vergleicht alle Details des Bildes mit der Datenbank und entscheidet, ob es sich um ein Bild eines Tieres oder eines Menschen handelt. Wenn es sich dann um einen Menschen handelt, wird versucht, das Geschlecht und das Alter bis hin zu der Person zu bestimmen. Der gleiche Vorgang wird für andere Objekte auf dem Foto wiederholt.
Außerdem werden Benutzerdaten wie die Identität der Person auf dem Bild und der Ort, an dem das Bild aufgenommen wurde, verwendet, um die Bibliothek zu erweitern und in Zukunft bessere Ergebnisse zu erzielen - sowohl für die Person, die das Foto hochgeladen hat, als auch für alle sonst. Daher der Begriff „Lernen“. Es geht aber nicht nur darum, Daten aus Fotos zu kennen und zu lernen. Es gibt so viel, dass die Technologie mit Informationen aus einem Foto umgehen kann. Beispielsweise können Fotos mit ähnlichen Details wie derselben Person, demselben Ort und demselben Datum gruppiert werden. Sehen Sie sich das Gesichtsmuster an, um festzustellen, zu welcher Familie und welchen Freunden die Person auf dem Foto gehört, und verwenden Sie die Informationen, um Videos von Familienurlauben oder Animationen aus Serienaufnahmen zu erstellen.
Das kratzt kaum an der Oberfläche der Funktionsweise von TensorFlow, aber ich hoffe, es kann Ihnen ein allgemeines Bild der Technologie geben. Außerdem kann die Verwendung nur eines Beispiels nicht dem gerecht werden, wozu es in der Lage ist.
Für alle Enthusiasten der künstlichen Intelligenz ist es erwähnenswert, dass Google bereits eine Computerchip-Technologie entwickelt hat, die für maschinelles Lernen und die Integration von TensorFlow optimiert ist. Es heißt ASIC-Chip der Tensor Processing Unit (TPU).
Wer mehr über TensorFlow erfahren möchte, kann die Tutorial-Seite besuchen.
Anwendungen von TensorFlow
Wir befinden uns in einem frühen Stadium der Technologie des maschinellen Lernens, sodass niemand weiß, wohin sie uns führen wird. Es gibt jedoch einige erste Anwendungen, die uns einen Blick in die Zukunft werfen könnten. Da es von Google stammt, ist es offensichtlich, dass Google die Technologie für viele seiner Dienste verwendet.
-
Mehr zur Bildanalyse
Wir haben das Beispiel der Verwendung der Technologie für die Bildanalyse in Google Fotos erörtert. Die Bildanalyseanwendung wird jedoch auch in der Street View-Funktion von Google Maps verwendet. Beispielsweise wird TensorFlow verwendet, um das Bild mit den Kartenkoordinaten zu verbinden und das Kennzeichen eines Autos, das versehentlich im Bild enthalten ist, automatisch zu verwischen.
-
Spracherkennung
Google verwendet TensorFlow auch für seine Spracherkennungssoftware für Sprachassistenten. Die Technologie, mit der Benutzer Anweisungen aussprechen können, ist nicht neu, aber die Einbeziehung der ständig wachsenden Bibliothek von TensorFlow in den Mix kann die Funktion um einige Stufen verbessern. Derzeit erkennt die Spracherkennungstechnologie über 80 Sprachen und Varianten.
-
Dynamische Übersetzung
Ein weiteres Beispiel für den Teil des Lernens in der Technologie des maschinellen Lernens ist die Übersetzungsfunktion von Google. Google ermöglicht seinen Nutzern, neue Vokabeln hinzuzufügen und die Fehler in Google Translate zu beheben. Die ständig wachsenden Daten können verwendet werden, um automatisch die Eingabesprache zu erkennen, die andere Benutzer übersetzen möchten. Wenn das Gerät Fehler bei der Spracherkennung macht, können Benutzer diese korrigieren. Und die Maschine wird aus diesen Fehlern lernen, um ihre zukünftige Leistung zu verbessern. Und der Zyklus geht weiter.
-
Alpha Go
Ein unterhaltsames Beispiel für die Verwendung von TensorFlow ist Alpha Go. Es ist eine Anwendung, auf die programmiert ist Go spielen. Für diejenigen, die mit Go nicht vertraut sind, ist es ein abstraktes Brettspiel für zwei Spieler, die vor mehr als fünftausendfünfhundert Jahren aus China stammten, und es ist das älteste Brettspiel, das heute noch ununterbrochen gespielt wird. Während die Regeln einfach sind - mehr Territorium als der Gegner zu umgeben -, ist das Spiel unglaublich komplex und laut Wikipedia: "Besitzt mehr Möglichkeiten als die Gesamtzahl der Atome im sichtbaren Universum."
Es ist also interessant, was eine Lernmaschinentechnologie mit den unendlichen Möglichkeiten anfangen kann. In seinen Spielen gegen Lee Sedol, den 18-fachen Go-Weltmeister, gewann Alpha Go 4 von 5 Spielen und erhielt den höchsten Rang eines Go-Großmeisters.
-
Magenta-Projekt
Eine weitere interessante Anwendung von TensorFlow ist das Magenta-Projekt. Es ist ein ehrgeiziges Projekt maschinengenerierte Kunst. Eines der ersten greifbaren Ergebnisse des Experiments ist die 90-Sekunden-Klaviermelodie. Langfristig hofft Google, mit seinem Magenta-Projekt fortschrittlichere maschinengenerierte Kunst zu generieren und eine Community von Künstlern aufzubauen.
Im Februar 2016 veranstaltete Google außerdem eine Kunstausstellung und Auktion in San Francisco, in der 29 computergenerierte - mit ein wenig menschlicher Hilfe - Kunstwerke gezeigt wurden. Sechs der größten Werke wurden für bis zu 8.000 US-Dollar verkauft. Der Computer hat vielleicht noch einen sehr langen Weg vor sich, bevor er einen echten Künstler imitieren kann, aber die Menge an Geld, die die Leute bereit sind, für die Kunst zu bezahlen, zeigt uns, wie weit die Technologie gegangen ist.
Unterstützung für iOS
Während wir bereits die Funktionen von TenserFlow auf Android mit seiner neuesten Version gesehen haben, fügt TensorFlow endlich Unterstützung für iOS-Geräte hinzu. Da es Unmengen großartiger mobiler Apps gibt, die exklusiv für iOS verfügbar sind oder zuerst für iOS veröffentlicht wurden, können wir in naher Zukunft weitere großartige mobile Apps erwarten, die maschinelles Lernen einführen. Gleiches gilt für die Möglichkeiten einer breiteren Einführung und Anwendung von TensorFlow.
Die Zukunft von TensorFlow
Was kann man möglicherweise mit einer Maschine machen, die lernen und ihre eigene Entscheidung treffen kann? Als eine Person, die sich im täglichen Leben mit mehr als einer Sprache befasst, fällt mir als erstes die Sprachübersetzung ein. Nicht in der Wort-für-Wort-Ebene, sondern eher in der längeren Textebene wie Dokumente oder sogar Bücher. Die heutige Übersetzungstechnologie beschränkt sich auf das Vokabular. Sie können leicht herausfinden, was auf Chinesisch „schläft“ und umgekehrt, aber versuchen Sie, ein Kapitel von Eiji Yoshikawas Musashi in seinem ursprünglichen Japanisch einzufügen und das Kapitel ins Englische zu übersetzen. Du wirst sehen, worauf ich hinaus will.
Es macht auch Spaß zu sehen, was die Zukunft der künstlichen Intelligenz mit Musik anstellen kann. Die Music Memo-App von Apple ist zwar noch sehr einfach, kann Ihren aufgenommenen Gesang jedoch bereits automatisch mit Bass und Schlagzeug begleiten. Ich erinnere mich an eine Episode einer SciFi-TV-Show, in der ein Charakter in der Show eine Maschine erstellt hat, die alle Top-Songs in den Charts analysiert und in der Lage ist, eigene Hits zu schreiben. Werden wir jemals dort ankommen??
Und als abschließenden Gedanken möchte ich erwähnen Sunspring. Es ist ein kurzer Science-Fiction-Film, der vollständig von einem KI-Drehbuchautor geschrieben wurde, der sich selbst nannte Benjamin - die sogar das musikalische Zwischenspiel des Popsongs komponierte. Der Film wurde von Regisseur Oscar Sharp für die 48-stündige Film Challenge des Sci-Fi London-Events zusammengestellt.
Jetzt kann ich nicht aufhören, an den Terminator zu denken. Willkommen in der Zukunft.
Bildnachweis: Wikipedia, TechInsider, The Verge, Wall Street Journal