Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

raportmniejszosci.pl prezentacja z 30 wrzesnia

1,612 views

Published on

Spotkanie w Collegium Civitas prezentujące przygotowania do projektu raportmniejszosci.pl

Published in: Technology
  • Be the first to comment

  • Be the first to like this

raportmniejszosci.pl prezentacja z 30 wrzesnia

  1. 1. MOWA NIENAWIŚCI I JĘZYK WROGOŚCI W POLSKIM INTERNECIE RAPORTMNIEJSZOSCI.PL Jacek Bieliński Marek Troszyński Aleksander Wawer
  2. 2. WIEDZALOKALNA.PL NASZYM CELEM JEST PRZEKSZTAŁCANIE WIEDZY O CHARAKTERZE AKADEMICKIM W WIEDZĘ UŻYTECZNĄ DLA DIAGNOZOWANIA POTRZEB I ROZWIĄZYWANIA PROBLEMÓW NA POZIOMIE LOKALNYM
  3. 3. RAPORTMNIEJSZOSCI.PL <ul><li>czyli „Opracowanie systemu monitorowania polskiego internetu pod kątem występowania mowy nienawiści i języka wrogości wobec mniejszości etnicznych, seksualnych, religijnych i innych”; </li></ul><ul><li>finansowany z programu ‘Demokracja w działaniu. Tolerancja’ Fundacji im. Stefana Batorego, </li></ul><ul><li>współpraca: Centrum Badań nad Nowymi Mediami Collegium Civitas </li></ul><ul><li>początek projektu: lipiec 2010; </li></ul><ul><li>koniec projektu: czerwiec 2011. </li></ul>
  4. 4. RAPORTMNIEJSZOSCI.PL ZAŁOŻENIA PROJEKTU
  5. 5. ZAŁOŻENIA PROJEKTU RAPORTMNIEJSZOSCI.PL <ul><li>sfera prywatna vs sfera publiczna </li></ul><ul><ul><li>media tradycyjne vs internet </li></ul></ul><ul><li>perspektywa liberalna vs. konserwatywno-tradycjonalistyczna </li></ul><ul><li>mowa nienawiści: </li></ul><ul><ul><li>silne (skrajne) negatywne emocje </li></ul></ul><ul><ul><li>przedmiot odniesienia wypowiedzi pojmowany jako przedstawiciel grupy (mniejszości) </li></ul></ul><ul><ul><ul><li>„ kowalski jest głupi” -> OK </li></ul></ul></ul><ul><ul><ul><li>„ ten żyd/ gej/ Słowak kowalski jest głupi” -> nieOK </li></ul></ul></ul>
  6. 6. STOSUNEK WOBEC MOWY NIENAWIŚCI W POLSCE Dane z badania: World Internet Project Poland, lipiec, 2010
  7. 7. STOSUNEK WOBEC MOWY NIENAWIŚCI W POLSCE Dane z badania: World Internet Project Poland, lipiec, 2010
  8. 8. STOSUNEK WOBEC MOWY NIENAWIŚCI W POLSCE Dane z badania: World Internet Project Poland, lipiec, 2010
  9. 9. RAPORTMNIEJSZOSCI.PL
  10. 10. ZBIERANIE INFORMACJI <ul><li>2 crawlery: </li></ul><ul><ul><li>skan całego polskiego internetu zaindeksowanego przez bing.com + uniwersalna metoda ekstrakcji treści z HTML, </li></ul></ul><ul><ul><li>przeszukanie forów na głównych portalach i komentarzy pod artykułami; </li></ul></ul><ul><ul><ul><li>dedykowane mechanizmy crawlowania rozpoznające poszczególne posty: treść, autorów (nicki piszących), strukturę wątków, datę </li></ul></ul></ul><ul><ul><ul><li>zastosujemy metodę ekstrakcji treści z HTML dostrojoną do każdego z forów </li></ul></ul></ul><ul><li>przeszukiwanie w oparciu o słowa klucze (+ synonimy) – określenia mniejszości </li></ul>
  11. 11. ANALIZA INFORMACJI <ul><li>rozpoznawanie wypowiedzi możliwe jest dzięki algorytmom przetwarzania języka naturalnego oraz uczenia maszynowego, </li></ul><ul><li>proces będzie się składał z następujących etapów: </li></ul><ul><ul><li>tokenizacja i podział na zdania, </li></ul></ul><ul><ul><li>analiza syntaktyczno-semantyczna zdań, </li></ul></ul><ul><ul><li>wyliczanie podobieństwa między wzorcowymi wypowiedziami mowy nienawiści a rozważaną wypowiedzią, z wykorzystaniem wektorowej reprezentacji znaczeń, osiąganej dzięki poprzednim etapom przetwarzania, </li></ul></ul><ul><ul><li>uczenie maszynowe - klasyfikacja tak reprezentowanej wypowiedzi jako potencjalnej mowy nienawiści </li></ul></ul><ul><li>moduł przypisujący wypowiedź do lokalizacji (geograficznej) </li></ul>
  12. 12. CYKL DZIAŁAŃ
  13. 13. PRZYKŁAD <ul><li>rozpoznanie pozytywnych (zielone) i negatywnych (czerwone) odniesień </li></ul>
  14. 14. REZULTAT <ul><li>publicznie dostępna (dla ngo/badaczy/prasy) baza danych zawierająca zbiór tekstów z polskiego internetu zakwalifikowanych jako mowa nienawiści; </li></ul><ul><li>przyjazny użytkownikowi interfejs umożliwiający selekcję tekstów wg wybranych kryteriów: </li></ul><ul><ul><li>mniejszości (przedmiotu wypowiedzi) </li></ul></ul><ul><ul><li>poziomu nasycenia mową nienawiści (np. skala 1-10) </li></ul></ul><ul><ul><li>lokalizacji (województwo) </li></ul></ul><ul><ul><li>daty włączenie do bazy. </li></ul></ul>
  15. 15. WYMIAR PRAKTYCZNY PRZEWIDYWANE POLA WYKORZYSTANIA
  16. 16. CELE PROJEKTU <ul><li>Kategoryzacja dyskursu publicznego w polskim internecie (odnoszącego się do mniejszości) </li></ul><ul><li>Zbieranie korpusu tekstów, który może być wykorzystywany przez badaczy z różnych dyscyplin nauk społecznych. </li></ul><ul><li>Cele praktyczne: </li></ul><ul><ul><li>skrajne przykłady mogą stać się podstawą do zawiadomienia prokuratury </li></ul></ul><ul><ul><li>‘ miękka presja’ na właścicieli portali, blogów, forów; </li></ul></ul><ul><ul><li>działanie w realnym wymiarze społecznym – wykorzystanie odniesienia do lokalności (np. zapobieganie narastającym konfliktom); </li></ul></ul><ul><ul><li>jako materiał edukacyjny (słowa nie są niewinne). </li></ul></ul>
  17. 17. OBIEKTYWIZACJA POPRZEZ BADANIE OPINII <ul><li>jak ocenić natężenie mowy nienawiści/języka wrogości? </li></ul><ul><li>badanie sondażowe na reprezentatywnej próbie internautów lub reprezentatywnej próbie dorosłych mieszkańców Polski. </li></ul><ul><li>Wskaźniki pozwalające na 'obiektywizację' (lub intersubiektywizację) ocen: </li></ul><ul><ul><li>seria kilkudziesięciu stwierdzeń do oceny na skali </li></ul></ul><ul><ul><li>odniesienie osobiste (Czy uznałby/aby P. za obrażające P. następujące wypowiedzi. Jak bardzo poczułby/aby się P. urażony) </li></ul></ul><ul><ul><li>odniesienie do mniejszości (Czy w P. przekonaniu następujące wypowiedzi obrażają daną mniejszość) – przedmiot wypowiedzi to określona mniejszość </li></ul></ul>
  18. 18. WĄTPLIWOŚCI I ZAGROŻENIA <ul><li>Zejście z piedestału obiektywności nauki? </li></ul><ul><li>Zagrożenie ograniczenia wolności słowa </li></ul><ul><li>Zarzut arbitralności oceny wypowiedzi </li></ul><ul><li>Zarzut arbitralności wyboru tekstów </li></ul><ul><li>Zarzut znikomej szkodliwości zjawiska </li></ul>
  19. 19. WĄTPLIWOŚCI I ZAGROŻENIA <ul><li>‘ Wielki Brat patrzy, czyli totalna inwigilacja’; </li></ul><ul><li>‘ kto dał wam prawo oceny’; </li></ul><ul><li>‘ też sobie możemy zrobić taką listę’; </li></ul><ul><li>‘ no tak, jest, i co z tego?’ </li></ul>
  20. 20. WSPÓŁPRACA <ul><li>Kampania przeciw Homofobii; </li></ul><ul><li>Stowarzyszenie Otwarta Rzeczpospolita; </li></ul><ul><li>Stowarzyszenie Nigdy Więcej. </li></ul>
  21. 21. DZIĘKUJEMY ZA UWAGĘ [email_address]

×