Nasi pracownicy uczestniczą w projekcie rozwojowym Uniwersytetu im. Adam Mickiewicza pt. System tłumaczenia automatycznego na potrzeby poprawy bezpieczeństwa publicznego, realizowanym w ramach Polskiej Platformy Bezpieczeństwa Wewnętrznego .
Razem z Wydziałem Matematyki i Informatyki Uniwersytetu im. Adama Mickiewicza w Poznaniu współpracujemy od lipca 2008 roku przy tworzeniu systemu do automatycznego tłumaczenia tekstów z zakresu bezpieczeństwa między językami polskim i angielskim. Jako baza wyjściowa służy program do tłumaczeń ogólnych (niespecjalistycznych) TRANSLATICA, oparty na danych Wielkiego słownika angielsko-polskiego i polsko-angielskiego PWN-Oxford, który zostanie przystosowany do specjalistycznego tłumaczenia z zakresu bezpieczeństwa.
Materiał językowy dla wyspecjalizowanego systemu tłumaczącego stanowią: policyjne teksty archiwalne (w tym protokoły przesłuchań, korespondencja z Interpolem itp.), unijne akty prawne, różnego rodzaju materiały dostępne w Internecie oraz z polsko- i angielskojęzyczne publikacje oraz słowniki związane z tematyką bezpieczeństwa. W pierwszej kolejności zespół programistów opracował szereg narzędzi językowych do obróbki dostępnych zasobów językowych, począwszy od gromadzenia, przez czyszczenie, konwertowanie i wyciąganie odpowiednich treści z Internetu, na narzędziach do edycji i przeglądania słownictwa skończywszy. Stworzyliśmy m.in. narzędzie do anonimizowania oryginalnych dokumentów policyjnych czy własne archiwum tekstów dwujęzycznych. Odpowiednio przygotowany materiał językowy szlifowany jest przez zespół doświadczonych lingwistów. Ich praca polega na edytowaniu haseł w słowniku pod kątem specjalizacji, dodawaniu nowych haseł, fraz i całych zdań, oraz na udoskonalaniu reguł tłumaczenia automatycznego.
Przewidywane zakończenie prac nastąpi w lipcu 2010 roku.