X
Technologia rozpoznawania mowy w walce z fałszywymi alarmami bombowymi
Prawo, Technologie

Technologia rozpoznawania mowy w walce z fałszywymi alarmami bombowymi

1 kwietnia 2016 2

Ramówki programów informacyjnych w okresie świątecznym wieją nudą. Relacje ze święcenia jajek, informacje o liczbie zatrzymanych nietrzeźwych kierowców, wiadomości z Bliskiego Wschodu, polityczne nawiązania w kazaniach duszpasterzy, czy w końcu zdjęcia oblewających się ludzi, to stałe elementy każdego świątecznego programu informacyjnego od lat. Za sprawą pijanego uczestnika imprezy poniedziałkowe serwisy zyskały jednak nowy temat – fałszywy alarm bombowy na lotnisku w Modlinie. Informacja o zatrzymaniu wszystkich 21 uczestników zabawy przez Policję może rodzić pytanie czy było to konieczne do ustalenia tego kto dzwonił w sprawie rzekomej bomby. Przy tego typu zdarzeniach pomocna okazać się może technologia rozpoznawania mowy.

Zakrapiana impreza

 

Zgodnie z informacjami podawanymi przez Policję w niedzielę 27 marca 2016 r. po godzinie 21 otrzymano informację, że na lotnisku w Modlinie ma wybuchnąć bomba. Służby potraktowały zgłoszenie bardzo poważnie i ewakuowano ok. 800 osób znajdujących się na lotnisku. Ustalono, że dzwoniono z małej miejscowości z powiatu nowodworskiego, brak jednak było pewności kto wykonał feralny telefon. Większość osób była pod wpływem alkoholu i podjęto decyzję o zatrzymaniu wszystkich uczestników imprezy. Wprawdzie sama rozmowa telefoniczna może wydawać się niewinna – to przecież wypowiedzenie kilku zdań do słuchawki telefonu, jednak konsekwencje nie były już tak błahe. Poza koniecznością zmiany grafika, dochodzą jeszcze finansowe skutki czasowego zamknięcia lotniska. Straty poniosły zarówno służby – zaangażowano w akcję Policję, Straż Pożarną i Straż Graniczną – jak i port lotniczy, linie lotnicze, które musiały wysłać swoje samoloty na Lotnisko Chopina i zmienić grafik lotów, ale także indywidualni podróżni, którzy mogli nie zdążyć na kolejny lot czy też na umówione spotkanie biznesowe. Wszystkie te podmioty mogą na drodze cywilnej dochodzić swoich praw od sprawcy, którego ponadto czeka odpowiedzialność karna i nawet 8 lat pozbawienia wolności.

 

Jak ustalić kto dzwonił?

 

Prawo karne nie przewiduje odpowiedzialności zbiorowej i konieczne jest ustalenie konkretnego sprawcy. Teoretycznie wiec, w sytuacji braku jakichkolwiek dowodów i zgodnego zaprzeczania swojego sprawstwa przez wszystkich 21 uczestników imprezy, nie można byłoby w ogóle nikomu przypisać odpowiedzialności karnej. Wiadomo byłoby więc, że sprawca jest wśród tej grupy, ale jednocześnie byłoby to za mało do postawienia komukolwiek zarzutów. Nie ma jednak zbrodni doskonałych, a co za tym idzie przeważnie istnieją sposoby na wskazanie „żartownisia”. Proces karny przewiduje wiele sposobów ustalenia prawdy, jaka stała za przestępstwem. Jakie są więc możliwe  sposoby na okrycie tego, kto zadzwonił do portu lotniczego w Modlinie?

 

  • Przyznanie się do winy. Pierwszym i najprostszym sposobem jest przyznanie się sprawcy do winy. Jeżeli wersja podana przez niego jest spójna i logiczna, może to stanowić solidne postawy do postawienia takiej osobie aktu oskarżenia.
  • Zeznania świadków. Nikt nie może zmusić sprawcy do samooskarżenia więc często to świadkowie zdarzenia pomagają organom ścigania w ustaleniu przebiegu zdarzenia. Gdyby więc kilku uczestników imprezy zgodnie twierdziło, że zrobił to ich kolega to na tej podstawie – i to mimo zaprzeczeń oskarżonego, można byłoby taką osobę skazać.
  • Nagranie wideo. Stan upojenia alkoholowego uczestników urodzin może jednak uniemożliwić uzyskanie spójnych zeznań od świadków. W takiej sytuacji można sprawdzić, czy istnieją nagrania wideo dokumentujące zdarzenie. Wydawać by się to mogło mało prawdopodobne, jednak w dobie wszechobecnych kamer mogą być one w wielu miejscach. Monitoring miejski lub ze stacji paliw mógł uchwycić moment telefonowania, właściciel lokalu mógł mieć zamontowaną kamerę, która pomaga mu kontrolować opiekunkę do dziecka, czy w końcu ktoś mógł użyć kamery, która znajduje się na wyposażeniu smartfona.
  • Daktyloskopia. Gdy wskazane wyżej sposoby zawiodą, można spróbować zebrać odciski palców znajdujące się na telefonie, z którego dzwoniono. Istnieje spore prawdopodobieństwo, że nie był on dotykany przez wiele osób więc byłoby to pomocne przy zawężeniu kręgu poszukiwań.
  • Osmologia. Dotykana przez sprawcę słuchawka telefonu może zawierać jego ślady zapachowe.  Specjalnie do tego wyszkolone psy mogą porównać ślady zostawione na telefonie z próbkami zebranymi od uczestników zabawy. Zgodność zapachowa może pomóc ustalić kto dotykał tego wieczoru telefonu, co może nas przybliżyć do poznania tożsamości sprawcy.

 

Rozpoznawanie mowy

 

Technologią, która może jednak w miarę pewny sposób powiązać telefon z jednym z 21 uczestników  zabawy jest rozpoznawanie głosu. W ostatnich latach rozpoznawanie głosu rozwinęło się, o czym świadczyć może sukces Siri, asystentki z iPhona, która pomaga zarządzać telefonem za pomocą  głosowych komend. Niestety, póki co Siri nie obsługuje języka polskiego, dlatego polscy użytkownicy urządzeń Apple nie mogą przekonać się o walorach tej użyteczności. Nie jest jednak tak, że w Polsce rozpoznawanie głosu w ogóle nie funkcjonuje. Pracują nad nim m.in. naukowcy z Akademii Górniczo-Hutniczej w Krakowie, którzy osiągają na tym polu spore sukcesy. Zespół Przetwarzania Sygnałów pod przewodnictwem prof. Mariusza Ziółko wykorzystuje technologię na różnych polach, a jest ich wiele. Rozpoznawanie mowy może służyć jako głosowa weryfikacja tożsamości w kontaktach z bankiem (zamiast tradycyjnych pytań kontrolnych), rozpoznawanie mówców (wskazywanie kto w danym momencie się wypowiada) czy do automatycznego protokołowania (zamiana mowy na tekst i wprowadzanie go do edytora tekstu).

 

 

Fonoskopia

 

Rozpoznawanie mówców może być wykorzystywane także na potrzeby prawa karnego. Fonoskopia to jedna z technik śledczych znanych w kryminalistyce, która od dziesięcioleci pomaga wykrywać sprawców z wykorzystaniem materiału głosowego. Mając nagranie telefoniczne z informacją o bombie, można z wysokim prawdopodobieństwem powiązać „właściciela” głosu z próbkami zebranymi od uczestników imprezy. Waldemar Maciejko w tekście „Biometryczne rozpoznawanie mówców w kryminalistyce” wskazuje na satysfakcjonujące rezultaty metody Automatycznego Rozpoznawania Mówców. Skuteczność tej metody jest tym większa, im dłuższy jest czas trwania materiału dowodowego. Co ciekawe technika rejestracji nie wpływa na skuteczność systemu – podobne rezultaty uzyskano dla nagrania z sieci GSM i  nagrania bezpośrednio do mikrofonu pojemnościowego w warunkach pokojowych. Jest to według cytowanego autora jedna z najszybciej rozwijających się metod biometrycznych.

 

Zakładając więc, że organy procesowe dysponowały nagraniem o bombie i znały tożsamość wszystkich osób biorących udział w imprezie, to nie było potrzeby zatrzymywania wszystkich 21 jej uczestników na komisariacie do czasu ich wytrzeźwienia. Wprawdzie takie działanie Policji jest wygodne (wiadomo, że sprawca jest w tej grupie), to jednak nawet chwilowe pozbawienie wolności 20 niewinnych osób wydaje się zbytnim wkroczeniem w sferę konstytucyjnie chronioną. Jeżeli mamy technologie, które pozwalają na osiągnięcie tego samego celu (wykrycie sprawcy) bez ingerencji w wolności obywatelskie, organy ścigania powinny z tej możliwości skorzystać.

  • Daniel Kot

    Super ciekawy tekst! Wkradła się tylko drobna i całkiem zabawna, w kontekście tematu, literówka: „werSyfikacja tożsamości” 😉

    • KamilMamak

      Dzięki za czujne oko – poprawione :)