Wir haben ein erfahrenes Team, das sich mit der Verarbeitung der natürlichen Sprache hervorragend auskennt. Wir bauen Werkzeuge, die den Kontakt zwischen der Maschine und dem Menschen erleichtern und auch eine Verarbeitung von Textdaten durch den Computer ermöglichen. Unten finden Sie Beispiele unserer Möglichkeiten und Gebiete, auf denen wir uns bewegen:
Textnormierung
Die Textnormierung ist ein automatischer Prozess der Verwandlung des geschriebenen Textes in die gesprochene Variante. Zum Beispiel:
200$ - > two hundred dollars
Die Normierung ist der erste unerlässliche Schritt, wenn wir wollen, dass der Computer einen Text, in dem verschiedene Abkürzungen oder Zahlen auftauchen, korrekt liest. Für das Polnische kann das eine ziemlich komplizierte Aufgabe sein, was so ein Beispiel schildert:
dla p. dr. J. Kowalskiego leg. się dow. osob. BAC1234567, zam. na os. B. Chrobrego 10 m 7, 61-100 Poznań
Wie sollte das gelesen werden? Vermutlich so:
für Herrn Doktors Jot Kowalski, der sich mit einem Personalausweis be a ce ce eins zwei drei vier fünf sechs sieben legitimiert, wohnhaft in der Siedlung Bolesława Chrobrego zehn Hausnummer sieben, einundsechzig hundert Posen
Das ist keine einfache Sache für einen Computer.
Es erwies sich, dass die Normierungsaufgabe der automatischen Übersetzung ganz ähnlich ist. Die Quellsprache ist hier der geschriebene Text und die Zielsprache ist die gesprochene Sprache. Deswegen haben wir entsprechende Untersuchungen durchgeführt und so ist ein Instrument zur Textnormierung als Modul des Programmes Translatica entstanden.
System der Bloggenerierung (SEO-TOOL)
Aufgrund der gesammelten lexikalischen Daten können wir Texte für Blogs generieren. Solche Texte werden Sinn und einen Grundgedanken haben und sie werden keine Anhäufung zufälliger Wörter mit korrekter Flexion sein. Unser Wissen und unsere Werkzeuge erlauben uns, Blogs mit einer bestimmten Thematik und der entsprechenden Sättigung mit den Schlüsselbegriffen zu generieren. Solche Werkzeuge können erfolgreich zum schnellen Aufbau der Basis zum Positionieren der Seiten verwendet werden, und ebenfalls können sie den Marketingszwecken dienen.
Wenn Sie einen Bedarf an derartigen Werkzeugen haben, bitten wir um Kontakt .
System der Textgenerierung "mit anderen Worten" (SEO-TOOL)
Ein wesentlicher Teil des Positionierens ist der Aufbau der Basis. Wir wissen, wie schwer es ist, individuelle Texte zu einem bestimmten Thema schnell und sicher zu finden, deswegen haben wir eine Methode erarbeitet, die die Texte in andere Texte mit anderen Wörtern und anderer Syntax umformen lässt, ohne dass die Bedeutung verloren geht. Zur Generierung brauchen wir einen Quellentext und je nach den Parametern und der Stufe der Unterschiede, können wir bis circa zwanzig Texte aufgrund dieses einen generieren, die keine Kopie des Quellentextes sind und gleichzeitig nicht über die Hauptthematik hinausgehen.
Vulgarismenschutz
Diese Gruppe von Werkzeugen dient zur Zensur von Vulgarismen und beleidigenden Äußerungen in Internetforen, Portalen, Systemen der öffentlichen Nützlichkeit, Kinderforen u.ä. Es ersetzt einen Menschen in dem oben genannten Bereich. Je nach der Version, erkennt das System nur Wörter, Ausdrücke oder ganze Kontexte. Wir empfehlen das Werkzeug herzlich - besonders Portalen mit Inhalten für Kinder.
Das intelligente Zusammenfassen der Artikel
Oft trifft man auf den Hauptseiten von Portalen oder Blogs Zusammenfassungen der Einträge und Artikel, die automatisch durchgeführt wurden. Die Wirkung dieser Algorithmen lässt viel zu wünschen übrig, weil sie sich z. B. auf den ersten Satz beschränken und wenn der erste Satz mit einer Abkürzung z. B. Prof. anfängt, dann bleibt die Abkürzung gerade in dieser Form. Unsere Instrumente zur Zusammenfassung funktionieren intelligent, denn sie benutzen z. B. die Textnormierung und die syntaktische Analyse und dadurch sind sie imstande, eine erforderliche Menge des Textes zur Zusammenfassung zu wählen.