05/12/2010
Instagram
Twitter - follow us
Facebook
Datová & kontextová žurnalistika
  • Data
  • Kontext
  • Číslo dne
  • Přesah
  • Témata
    • Ekonomika
    • Kultura
      • Filmový kalendář
    • Lidská práva
    • Média
    • Politika
    • Společnost
    • Sport
    • Školství
    • Vzdělání
    • Zdravotnictví
  • Speciály
    • Lidé v pohybu
    • Mediální gramotnost
    • Sociální bydlení
    • Sociální inkluze
    • Stárnutí populace
    • Svoboda médií
    • Volby
    • Ženy a muži
  • Redakce
LATEST
  • Kdo vydělává na drahém benzínu
  • Timeline: Média 2025
  • Podcast Mahdalky: O penězích
  • Stoprocentně objektivní žurnalistika neexistuje
Datová & kontextová žurnalistika
Kdo vydělává na drahém benzínu
Datová & kontextová žurnalistika
Datová & kontextová žurnalistika
Timeline: Média 2025
Datová & kontextová žurnalistika
Podcast Mahdalky: O penězích
Datová & kontextová žurnalistika
Stoprocentně objektivní žurnalistika neexistuje
Datová & kontextová žurnalistika
AI není zlá. Je urputná. A
Datová & kontextová žurnalistika
Kriminalita ve středověku: Mapa vražd z
Home > Kontext Analýzy
632 views 4 min 0 Comment

Analýza sentimentu: Barometr nálady

Redakce - 05/12/2010

Počítačovému software to jde dobře s čísly a tvrdými daty vůbec. Bude se mu ale dařit u detekce nálad a pocitů? Analýza sentimentu je dnes součástí vyhledávacích enginů. Výběr zboží nebo dovolené se bez zelené a červené barvičky téměř neobejde. To platí i pro recenze knih, hudby nebo filmů. O hodnocení nálad dedikovaných internetových fór a diskusí ani nemluvě.

Začalo to sémantickým diferenciálem, se kterým přišel Charles E. Osgood a jeho kolegovéSuci a Tannenbaum v r. 1957. Vše pak sepsali v knize The Measurement of Meaning.

Nepřehlédnutelnou výhodou sémantického diferenciálu je jeho jednoduchost a možnost projekce do různých kultur a věkových skupin. I proto je stále příznivě vnímán širokou odbornou veřejností.

Klíčovými nositeli sentimentu jsou přídavná jména. Standardní forma sémantického diferenciálu s klasickým bodovým hodnocením bipolární škály adjektiv vypadá takto:

Dobrý 1_______2_______3______4______5_______6_______7 Špatný

nebo:

Dobrý 3_______2_______1______0______1_______2_______3 Špatný

(kde: 3 = velmi, 2 = dost, 1 = trochu a 0 = ani-ani)

Sémantický diferenciál se s výhodou používá k efektivnímu zjištění psychosémantické sítě. Pomocí něho a faktorové analýzy Osgood zjistil, že určitý pojem si každý člověk zařadí do svého sémantického prostoru, čímž se dostal k jednoznačné metrice pro určování významu slov. Ty je potřebné posuzovat ze tří základních pohledů. Jde o tyto tři emoční dimenze psaného textu:

  • Hodnocení (posouzení pojmu pomocí bipolárních adjektiv; pozitivní – negativní)
  • Potence (účinek výpovědi je silný – slabý)
    • distance (vztah autora k tématu)
    • specifičnost (forma formulace: jasná, vágní)
    • určitost (autor si je jistý nebo je na pochybách?)
  • Intenzita (emotivnost výpovědi)

Tyto tři kategorie a jejich podkategorie lze rovněž s výhodou použít pro automatickou detekci a klasifikaci pocitů a určení sentimentu konkrétního textu – např. počítačem.

Nutnou podmínkou úspěšnosti analýzy sentimentu je použití speciálních slovníků, které dokáží postihnout ironii, sarkasmus, slang nebo idiomatická spojení zkoumaného textu. Všechny jejich formy jsou totiž velmi časté v internetových diskusích. Kombinované navíc grafikou emotikonů (smajlíci, palce nahoru/dolů, apod.).

Jedním z prvních experimentů na poli analýzy sentimentu byla studie dvou dam, Bo Panga Lillian Lee, které se na počátku tohoto století zabývaly analýzou filmových recenzí na internetu. Společně též napsaly monografii Opinion Mining and Sentiment Analyses. Ta se rovněž řadí k prvním v této oblasti.

Závěrem ukázka analýzy sentimentu na stránkách BBC. Pro akci je nutné stisknout tlačítko START. Vše ostatní lze řídit pomocí panelu na levé straně.

Zdroj: Captaview’s Blog

 

Štítky: média, sociální média, sociální sítě, Yeseter

PREVIOUS

Kojící otcové

NEXT

Nenápadný půvab dat aneb Úvod do datové žurnalistiky (I.) – teorie
Related Post
03/03/2013
Zeman jako pokračování Klause. Toho se lidé bojí nejvíc
01/12/2015
Máte problém s mým věkem?
08/03/2016
Proč potřebujeme ženy
17/02/2015
Vývoj nezaměstnanosti v letech 2000–2015
Comments are closed.
Kdo vydělává na drahém benzínu
02/04/2026
Timeline: Média 2025
04/02/2026
Podcast Mahdalky: O penězích
22/01/2026
Absolventi: riziková skupina
Datová & kontextová žurnalistika
Datová & kontextová žurnalistika
Šance na trhu práce: Základní vs.
Datová & kontextová žurnalistika
Schopnost změnit obor nebo si práci
Datová & kontextová žurnalistika
Českým dětem hrozí chudoba výrazně víc

Výběr

Datová & kontextová žurnalistika
Volební kalkulačka: nástroj, který skutečně rozhoduje
Datová & kontextová žurnalistika
Sněmovna v datech: Vládly nám děti a nikdo to neřešil
© Datová žurnalistika 2014-25