Inimese häälega kuulamine võib olla kindel, kus nad elavad Ameerika Ühendriikides. Selgub, et need samad murded jätavad Twitteris rohkesti.
Teadlased Carnegie Melloni ülikooli (CMU) arvutiteaduskoolis on hiljuti leidnud, et piirkondlikud slängid ja murded on üheselt tuntud ka tweetsides, nagu need on igapäevastes vestlustes.
Varem olid regionaalsete murrete uuringud põhinevad suulisel intervjuudel. Kuigi kirjalikud teatised ei peegelda piirkondlikke mõjusid tänu ametnike tasemele, mida inimesed endale võtavad, pakub Twitter teisest küljest uut moodust piirkondlike murrete uurimiseks, kuna tweets kipub olema mitteametlik ja jutukas. [Dead Keeled näitavad kadunud maailma]
CMU masinloetmisosakonna doktorikunstnik Jacob Eisenstein ütles, et automatiseeritud meetod, mida ta ja tema kolleegid on välja töötanud, et analüüsida Twitteri sõnastikku, näitavad, et piirkondlikud dialektid kujunevad sotsiaalmeedias.
Uuringute jaoks kogus Eisenstein ja tema meeskond 2010. Aasta märtsis Twitteris sõnumite väärtust nädala väärtuses ja valisid geoteksti (lisatud geograafilise identifitseerimise kaudu meediast, nagu fotod, video, veebisaidid, SMS-id või RSS-kanalid) Twitteri kasutajad, kes kirjutasid vähemalt 20 sõnumit. See andis andmebaasi 9500 kasutajat ja 380 000 sõnumit.
Nad avastasid teatavad regionaalsused, mis on juba hästi tuntud ja seotud riigi konkreetsete valdkondadega. Näiteks lõunane "y'all", "Pittsburghers" "yinz", samuti tavaline piirkondlik lõhe viited sooja, popi ja koksi kohta.
Kuid muud sõnad on kujunenud sotsiaalse meediaga ise.
Põhja-Californias on midagi, mis on lahe, "koo" tweets, samas kui Lõuna-Californias on see "coo". Paljudes linnades on midagi "sumthin", kuid tweets New Yorgi kasuks "suttin". Kuigi paljud meist võivad väidetavalt "väga" väsinud häält avaldada, on Põhja-California inimesed pigem "väsinud", uued jahedased on "deadass" väsinud ja Angelenos on lihtsalt väsinud "af", mis tähistab "f * **. "
Eisenstein arvab, et mõnda sellist kasutamist kujundab Twitter sõnumite 140-kohaline piirang, kuid ka geograafia mõju on ilmne. Statistiline mudel, mida uurimisrühm kasutas, et ära tunda regionaalseid erinevusi sõnastikus ja teemadel, võiks prognoosida tweeteri asukohta Ameerika mandriosas, kusjuures keskmine viga on umbes 300 miili.
Twitteri sõnumi voogude automaatne analüüs pakub keeleteadlusele võimalust jälgida piirkondlikke dialekte reaalajas. "See on huvitav näha, mis juhtub," ütles Eisenstein. "Kas" suttin "jääb sõna, mida me näeme peamiselt New Yorgis või kas see levib?"
Siin on nimekiri mõnest sagedamini kasutatavast slängist Twitterist.
Eisenstein esitab uuringu 8. jaanuaril Pitsburgis toimunud Ameerika keelekogukonna koosolekul.
Teadlased on suutnud kasutada twitteri slängi, et tuvastada, kus kasutajad elavad.