Posiadamy doświadczony zespół, który doskonale czuje się w zadaniach związanych z przetwarzaniem języka naturalnego. Budujemy narzędzia, które ułatwiają kontakt maszyny z człowiekiem a także umożliwiają przetwarzanie danych tekstowych przez komputer. Poniżej znajdziecie Państwo przykłady naszych możliwości i obszarów, po których się poruszamy:
Normalizacja tekstu
Normalizacja tekstu to automatyczny proces zamiany tekstu w formie pisanej (ortograficznej) na formę mówioną. Na przykład:
200$ -> two hundred dollars
Normalizacja jest niezbędnym pierwszym krokiem, gdy chcemy, by komputer prawidłowo przeczytał tekst, w którym znajdują się przeróżne skróty, czy liczby. Dla języka polskiego może to być zadanie całkiem skoplikowane, co obrazuje taki przykład:
dla p. dr. J. Kowalskiego leg. się dow. osob. BAC1234567, zam. na os. B. Chrobrego 10 m 7, 61-100 Poznań
Jak to powinno być przeczytane? Zapewne tak:
dla pana doktora jot kowalskiego legitymującego się dowodem osobistym be a ce jeden dwa trzy cztery pięć sześć siedem, zamieszkałego na osiedlu bolesława chrobrego dziesięć mieszkania siedem, sześćdziesiąt jeden sto Poznań
To nie jest prosta sprawa do komputera.
Okazuje się, że zadanie normalizacji jest całkiem podobne do tłumaczenia automatycznego. Tutaj, językiem, z którego tłumaczymy jest tekst pisany, a językiem, na który tłumaczymy, jest tekst mówiony. Dlatego przeprowadziliśmy odpowiednie badania i powstało narzędzie do normalizacji tekstu jako moduł programu Translatica.
System generowania blogów (SEO-TOOL)
Na podstawie zgromadzonych danych leksykalnych możemy generować teksty do blogów. Teksty takie będą posiadały sens i myśl przewodnią i nie będą zbitką przypadkowych słów o poprawnej odmianie. Nasza wiedza i posiadane narzędzia pozwala nam na generowanie blogów o pożądanej tematyce i odpowiednim nasyceniu słowami kluczowymi. Narzędzia takie mogą być z powodzeniem wykorzystywane do szybkiego budowania zaplecza do pozycjonowania stron, a także mogą służyć celom marketingowym.
Jeśli posiadacie Państwo zapotrzebowanie na tego typu narzędzia to prosimy o kontakt.
System generowania tekstów "innymi słowami" (SEO-TOOL)
Bardzo istotną częścią pozycjonowania jest budowanie zaplecza. Wiemy, jak trudno jest pozyskać szybko i bezpiecznie indywidualne teksty na dany temat, dlatego opracowaliśmy metodę przekształcania tekstów w ten sam znaczeniowo ale zbudowany za pomocą innych słów oraz innej składni. Do wygenerowania potrzebny jest tekst źródłowy i w zależności od parametrów i stopnia różnic, możemy wygenerować od kilku do kilkunastu tekstów na podstawie tego jednego, które nie będą kopią tekstu źródłowego a jednocześnie nie wyjdą poza źródłową tematykę.
Antybluzgacze
Ta grupa narzędzi służy do cenzurowania w zakresie wulgaryzmów, obraźliwych zwrotów na forach, portalach, systemach użyteczności publicznej, forach dziecięcych itp. Zastępuje ono w wyżej wymienionym zakresie człowieka. W zależności od wersji, system działa tylko na słowa, na zwroty, bądź na konteksty. Polecamy narzędzie gorąco - szczególnie portalom z treścią przeznaczoną dla dzieci.
Inteligentne streszczanie artykułów
Często spotyka się na głównych stronach portali lub blogów streszczenia wpisów i artykułów dokonanych w sposób automatyczny. Działanie tych algorytmów pozostawia wiele do życzenia, gdyż np. ograniczają się do pierwszego zdania, a jeśli pierwsze zdanie zaczyna się od np. Prof. to skrót będzie w tej właśnie postaci. Nasze narzędzia do streszczania działają inteligentnie, gdyż korzystają z np. normalizacji tekstu i analizy składniowej dzięki czemu są w stanie precyzyjnie wybrać pożądaną ilość tekstu do streszczenia.