Semantisches Netz – Die Bedeutung von Wörtern

Was ist das?

Als erstes muss man verstehen was Semantik bedeuted. Semantik ist griechisch und bedeuted „bezeichnen“. Es steht für die Bedeutung hinter einem Wort. Diese Bedeutung kann man verküpfen mit anderen Bedetuungen. z.B. das Wort Baum kann man mit Blatt oder Stamm verbinden weil ein Baum aus eben diesen Teilen besteht. Somit kann man sich eine Mindmap aufbauen, die mit einem Graph bzw. einem semantischem Netz, darstellbar ist. Solche Graphen verwendet man bei der Sprachanalyse in Übersetzungsprogrammen um den Sinn hinter dem Satz gleich zu lassen, und den Satz besser zu übersetzen, denn eine 1 zu 1 Übersetzung der Worte geht sehr schnell schief.

Beispiel

Klassisches Beispiel: „Your english is not the yellow from the egg“ von „Dein Englisch ist nicht das gelbe vom Ei.“ Im Englischen macht dieser Satz somit null Sinn 😀 Vielmehr muss man die Bedeutung hinter dem Satz verstehen um es richtig übersetzen zu können. Bei solchen Sprichwörtern ist das natürlich besonders schwer, da es sich um ganze Sätze und nicht nur um einzelne Worte handelt.

Ich will aber nur zeigen wie es mit einzelnen Wörtern ist. Im folgenden habe ich ein sehr einfaches Modell eines solchen semantischen Netzwerks aufgezeichnet:

Ein einfaches semantisches Netz
Ein Beispiel für ein einfaches semantisches Netz

Ich werde in Zukunft vielleicht eine solche Graphstruktur mit einigen Einträgen in einer Datenbank abbilden  und dann ein paar coole Sachen damit testen. (In der Zwischenzeit evtl. auch interessant: Baumstruktur in Datenbank speichern)

Wie man ganze Sätze damit verbindet und abspeichern kann wäre noch interessant damit aber es gibt sicher gute Lösungen dafür.

Weiterführende Links

Wikipedia → Semantik

Bilderkennung und OCR mit OpenCV (Emgu) unter .NET

Bilderkennung - Automatische Texterkennung markiert Buchstaben

Was ist OpenCV?

Open bedeutet offen. Das CV steht für Computer Vision. Da ich schon länger mit dem Gedanken gespielt hab das Ganze mal zu testen, habe ich nun endlich eine Bilbiothek für Bilderkennung gefunden. Das ganze läuft im .Net Framework von Microsoft und ich habe es unter Visual Basic ausprobiert.

Bilderkennung mit OpenCV

Hauptsächlich habe ich die optische Ziffern- und Buchstabenerkennung getestet und muss sagen, dass es ein echt cooles Werkzeug ist um Informationen aus Bildern zu gewinnen. Das ganze wurde von Google unter dem Projektnamen Tesseract gefördert. Die Software ist frei (open source). Mehr Information gibt es auf Wikipedia.

Die Erkennung der Bilder erfolgt zuverlässig bei gut lesbaren Fonts und einer Schriftgröße, welche mindestens 10px hoch ist (eigene Erfahrung).

Wo finde ich es?

Für die Implementierung von OpenCV habe ich Emgu verwendet welche die Bibliotheken für VB.NET und C# bereitstellt. Mehr Information sowie den Download findet ihr auf http://emgu.com

Wie kann ich es lernen?

Außerdem gibt es auf Youtube ein oder mehrere sehr nützliche Videos zu dem Thema Bilderkennung. Dadurch fällt die Implementation nicht schwer und kann schnell in euer Projekt übernommen werden.

Eventuell lade ich noch ein Beispielprojekt mit Sourcecode hoch, damit ihr euch die Tipparbeit erspart 😉

Datenvisualisierung, Infographics, Statistiken, Imformationsvisualisierung

Jeder sieht sich gerne Infografiken an oder interessiert sich für einfach dargestellte Statistiken oder eine schöne Datenvisualisierung. Vorraussetzung ist, das sie simpel und so einfach wie möglich gestaltet sind damit sie leicht und schnell zu verstehen sind. Daten und Informationen werden immer wichtiger für uns und täglich wächst die Menge an Information im Internet.

Große Daten zu kleinen Daten

Wie sollen alle diese Daten überhaupt beherrscht werden, bzw. wie kommt man mit diesen riesigen Datenmengen überhaupt klar? Es entstehen neue Studiengänge an den Universitäten wie zum Beispiel Datenanlyse oder DataMining. Es sollen also aus den Unmengen an erzeugten Daten neue Erkenntnisse gewonnen werden. Um Datenvisualisierung richtig zu machen werden viele Informationen auf wenige einfache Bilder und Symbole heruntergebrochen.

Welche coolen Möglichkeiten es in der Darstellung von Daten gibt, welche Prinzipien man beachten sollte beim Visualisieren und wie man die Informationen möglichst einfach zum Betrachter kommuniziert erklärt Jörn Loviscach sehr anschaulich in dem folgenden YouTube Video:

Ich bin gespannt wie die Informationsgrafiken und Datenvisualisierungen der Zukunft aussehen. Das Potenzial für einfachere Darstellungen ist meiner Meinung nach enorm und könnte ein wichtiger Zukunftstrend werden.

Zukunft der Datenvisualisierung

Viel damit hat auch mit ergonomischer Gestaltung und Mensch-Maschine Interaktionen zu tun. Nicht nur eingeschränkten Personen mit z.B. schlechten Augen, sonder jedem hilft es, wenn wichtige Informationen möglichst schnell und barrierefrei und vor allem verständlich zu bekommen sind.