Zadeva :Analiza podatkov
Tema :Analiza razpoloženja ocen izdelkov
Cilj :Cilj te naloge je izvesti analizo razpoloženja o ocenah izdelkov, da bi ugotovili mnenje ocenjevalca do izdelka.
Navodila :
1. Priprava podatkov :
- Zberite nabor podatkov o ocenah izdelkov iz ustreznega vira (npr. Amazon, Yelp).
- Očistite podatke tako, da odstranite podvojene ocene, obravnavate manjkajoče vrednosti in pretvorite besedilo v male črke.
2. Raziskovalna analiza podatkov :
- Raziščite podatke, da razumete njihove značilnosti in porazdelitev.
- Izvedite osnovne statistike, kot so štetje pogostosti in besedni oblaki, da prepoznate pogoste besede in besedne zveze, uporabljene v pregledih.
3. Analiza razpoloženja :
- Uporabite ustrezno knjižnico ali orodje za analizo razpoloženja (npr. TextBlob, VADER ali spaCy), da vsakemu mnenju dodelite ocene razpoloženja.
- Združite kritike v pozitivne, negativne ali nevtralne kategorije glede na njihovo razpoloženje.
4. Inženiring funkcij :
- Iz mnenj izvlecite pomembne značilnosti, ki bi lahko prispevale k občutku. To lahko vključuje pogostost besed, ločila ali druge funkcije, povezane z NLP.
5. Model strojnega učenja :
- Razvijte model nadzorovanega strojnega učenja za razvrščanje ocen kot pozitivnih ali negativnih.
- Naučite model na označenih podatkih in ocenite njegovo delovanje z ustreznimi metrikami (npr. točnost, natančnost, priklic in rezultat F1).
6. Razlaga modela :
- Vizualizirajte napovedi modela z uporabo matrik zmede ali drugih ustreznih vizualizacij.
- Analizirajte napačno razvrščene preglede, da ugotovite področja za izboljšave.
7. Poročanje :
- Napišite poročilo, v katerem povzemate ugotovitve analize razpoloženja.
- Vključite podrobnosti o pripravi podatkov, raziskovalni analizi podatkov, inženiringu funkcij, modelnem usposabljanju in rezultatih vrednotenja.
Oddaja :
- Predložite naslednje:
- Jupyter Notebook ali skript Python, ki vsebuje vašo kodo in analizo.
- PDF poročilo s povzetkom ugotovitev.
Rok :
– Nalogo je treba oddati [datum].
- Za prepozne oddaje bo zaračunana kazen v višini 10 % na dan.