Sentimentide analüüs Excelis! Microsoft Labsil on tasuta lisandmoodul, mis võimaldab teil Excelis sentimentide analüüsi teha. Mis siis, kui peate uurima sadu uuringukommentaare, et näha, mida inimesed teie ettevõttest arvavad? Excel saab määrata tõenäosuse, mis näitab, kui positiivne või negatiivne on iga kommentaar.
Vaata videot
- Uuringuandmeid on lihtne kvantifitseerida, kui need on valikvastustega
- Pöördtabeli abil saate teada, kui suur protsent on igal vastusel
- Aga kuidas on vabas vormis tekstivastustega? Neid on raske töödelda, kui teil on neid sadu või tuhandeid.
- Sentiment Analysis on masinapõhine meetod positiivse või negatiivse vastuse ennustamiseks.
- Microsoft pakub tööriista, mis teeb sentimentide analüüsi Excelis - Azure Machine Learning.
- Traditsiooniline meeleolude analüüs nõuab inimeselt 5% väidete analüüsimist ja kategoriseerimist.
- Traditsiooniline meeleolude analüüs ei ole paindlik - teete iga tööstusharu jaoks sõnastiku uuesti üles.
- Excel kasutab MPQA subjektiivsuse leksikat (selle kohta lugege lehelt http: // bit. Ly / 1SRNevt)
- See üldine sõnastik sisaldab 5097 negatiivset ja 2533 positiivset sõna
- Igale sõnale on määratud tugev või nõrk polaarsus
- See sobib suurepäraselt lühikeste lausete jaoks, näiteks säutsude või Facebooki postituste jaoks
- Topeltnegatiividega võib see petta saada
- Installimiseks minge jaotisse Lisa, Exceli pood, otsige Azure Machine Learning
- Määrake väljundivahemiku jaoks sisendvahemik ja kaks tühja veergu.
- Sisestusvahemiku pealkiri peab vastama skeemile: tweet_text
- Kaasartikkel aadressil: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Video ärakiri
Õppige Exceli Podcastist, osa 2062: Sentimentide analüüs Excelis
Oh hei, see oli tänuöö õhtu ja me istusime kõrvitsapiruka ümber ja Jes, meie sõber, hakkas Twitteri andmetes sentimentide analüüsi tegema. Ja ma ütlesin: "Kuule, sa tead, et Excelil on viis sentimentide analüüsimiseks." Ja sain aru, et mul pole selle või selle kohta ühtegi head videot, nii et see video räägib Excelis sentimentide analüüsimisest.
Nüüd on esimene küsimus, et mida kuradit on sentimentide analüüs? Ja kui teete oma klientidele uuringu ja neil on valikvastustega valik, kus nad saavad valida 1 kuni 5 vahel, siis on seda tõesti väga lihtne analüüsida. Saate lihtsalt luua väikese pöördtabeli: sisestage pöördtabel, siin olev olemasolev tööleht, klõpsake nuppu OK. Me tahame teada sealset küsimust või vastust küsimusele ja siis, kui palju vastuseid oli igaühe jaoks ning see annab meile absoluutarvu. Võite isegi siia tulla ja muuta selle valiku Välja sätted väärtusele Näita väärtusi protsendina veeru kogusummast.
Hästi, nii et näete iga vastuse puhul, kui suur osa inimestest saab vastuse. Hea küll, kuid meeleolude analüüs on mõeldud siis, kui teil on tõesti pikk vastus, kus te ütlete: "Hei, olgu, hästi, tead, ütle meile, miks sa meile selle vastuse andsid?" Ja nemad, teate, kasutavad lauseid või lõike. Noh, kui teil on neid sadu või tuhandeid, on kellelgi väga raske seda läbi vaadata ja kõik läbi lugeda ning aru saada, mis toimub, olgu?
Seega on olemas kahte erinevat meeleolude analüüsi. Tavaliselt kasutasite varem inimese juhendatud õpialgoritmi. Nii et kui teil oli 5000 vastust, siis mine tead, 200 neist ja vali positiivsed ja negatiivsed sõnad ja fraasid. Ehitate sisuliselt positiivsete ja negatiivsete sõnade sõnastikku; aga tead, see oli väga piirav. Kui tegite seda koha jaoks, kus tehti autoremonti ja siis oli teine klient, teate, kes tegi vaibapuhastust, on need kaks sõnastikku täiesti erinevad. Masinõppimist või inimese juhendatud õppimist tuleb teha ikka ja jälle. Nii kasutab Excel seda asja, mida nimetatakse MPQA subjektiivsuse leksikoniks, ja võite selle Google'i kasutada. Selle kohta on teave - 5097 negatiivset sõna, 2533 positiivset sõna. Ja nii,see sobib suurepäraselt lühikeste lausete või säutsu või Facebooki postituste jaoks. Kuid üks asi, mida ma olen märganud, on see, et kui keegi kirjutab topeltnegatiivis, ei saa ma öelda, et ma seda funktsiooni ei vihka, noh, masinõpe ebaõnnestub seal. Ja pagan, ma kukun läbi. Ma ei oska öelda, kas nad on õnnelikud või mitte.
Hästi, nii et siin me teeme. Rakenduses Excel 2013 või Excel 2016 minge vahekaardile Lisa, minge poodi, kui kuvatakse otsingukasti Azure Machine otsimine ja saate Azure Machine Learning'i just sealt. Klõpsame nuppu Lisa. Olgu, ja siin on kaks erinevat tööriista: Titanicu ellujäänu ennustaja, mis on lõbus; ja tekstimõtete analüüsi Exceli lisandmoodul. Kasutame seda. Hästi, siin on paar asja, mis teid üles ajavad. Teie pealkiri: Võtke vastuse selgitamiseks lõik. See peab sobima skeemiga ja skeem ütleb, et pealkiri peab ütlema tweet_text. Niisiis, siin üleval: tweet_text, muidugi, tõstutundlikud asjad, olgu. Seejärel sulgege skeem ja siis ennustage, sisend: A1 kuni 100, minu andmetel on päised, väljund: DataB1, kaasake päised. Nad annavad meile 2 veergu.Veenduge, et teil oleks seal 2 tühja veergu; muidu alistab see andmed. Teil on 2 valikut: paar rida korraga või partiina. See on vaid sada, nii et see pole tegelikult oluline. Valin Ennusta ja BAM! Lihtsalt nii kiiresti.
Hästi, saame 2 veergu: saame sentimenti ja skoori, olgu. Niisiis, esitagem siin skoore protsentides hulga kümnendkohtadega. Hea küll, seega 47,496, see ulatub 0-lt 100% -ni. 100 lähedal on äärmiselt positiivne, 0 lähedal on äärmiselt negatiivne, eks? Nii et siin on meil üks probleem, kus on väike probleem, ajab mind hulluks. Ei leia lahendust, nii et näete, miks seda hinnatakse äärmiselt negatiivseks. Vaatame ühte, mis tuleb äärmiselt positiivne. Hästi, nii et teate, nii et meil on siin mõned õnnelikud sõnad: palun ja aitäh, hüüumärgid ja nii edasi. See võib aidata kaasa kõrgele skoorile. Hästi, kas see on siis täiuslik? Ei, kuid see annab teile kiire ja kiire viisi öelda teile, kui paljud inimesed on nende vastuste üle äärmiselt õnnelikud või äärmiselt negatiivsed.
Ja muidugi, jällegi, siin saame seda teha pöördtabeli abil: Sisesta, Pivot-tabel, minge siinsesse olemasolevasse töölehele, klõpsake nuppu OK ja meid huvitab Sentiment ja siis võib-olla keskmise tulemusega igaüks neist. Nii et muudame selle jaotises Välja sätted keskmiseks, klõpsake nuppu OK. Ja nii või võib-olla isegi krahv. Küllap tahaksime teada krahvi, kui palju inimesi. Nii et võtame mõne muu valdkonna ja nii, me teame, kui palju inimesi olid negatiivsed. Oeh, kui palju inimesi oli neutraalseid, kui palju positiivseid inimesi ja milline oli nende kõigi keskmine tulemus.
Hästi, nii et kui teil on küsitlusandmeid ja see on valikvastustega, saate hõlpsalt kasutada pöördtabelit, et teada saada, kui suur protsent on igal vastusel. Kuid vabas vormis tekstivastuste jaoks on seda raske töödelda. Kui teil on neid sadu või tuhandeid, on meeleoluanalüüs masinapõhine meetod positiivse või negatiivse vastuse ennustamiseks. Microsoft pakub selleks tasuta tööriista. Töötab rakenduses Excel 2013 või Excel 2016, nimega Azure Machine Learning. Tavaliselt tuleb 5% lausetest käsitsi käsitsi läbi käia ja kategoriseerida. See pole paindlik, peate iga uue andmekogumi jaoks kategooriad ümber kategoriseerima, kuid Excel kasutab seda MPQA subjektiivsuse leksikonit. See on üldine sõnastik. See töötab lühikeste lausete, säutsude, Facebooki postituste jaoks. Ma võin topeltnegatiividest petta. Nii et minge lihtsalt Exceli poodiotsige Azure Machine Learning'i. Määrake väljundivahemiku jaoks sisend ja kaks veergu. Ärge unustage sel konkreetsel juhul pealkirja muuta, et see sobiks skeemiga, tweet_text.
Hästi, nii et sa lähed. Järgmine kord, kui teil on analüüsimiseks suur andmemaht, vaadake Exceli 2013 tasuta lisandmoodulit Azure Machine Learning. Täname, et peatusite, näeme järgmine kord järgmise netisaate jaoks.
Laadige fail alla
Laadige näidisfail alla siit: Podcast2062.xlsm