-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathintro.tex
executable file
·91 lines (67 loc) · 8.61 KB
/
intro.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
\drop{Ξ}{ΕΚΙΝΩΝΤΑΣ}
την προσπάθεια να περιγραφούν τα διάφορα μέρη που ασχολείται και υλοποιεί η
παρούσα εργασία, πρέπει να εξετάσουμε τα διάφορα μέρη της ξεχωριστά, ώστε
να γίνουν κατανοητά όσο πιο εύκολα και ομαλά γίνεται.
\section{Δεδομένα και επεξεργασία}
Το διαδίκτυο έχει γίνει ένα πολύ σημαντικό εργαλείο για την
επικοινωνία μεταξύ χρηστών, την ενημέρωση τους και την έκφραση
της άποψής τους. Όλες αυτές οι ενέργειες προκαλούν τη δημιουργία ενός
τεράστιου όγκου πληροφοριών.
Η υπερπληθώρα των δεδομένων αυτών καθιστά, την κατηγοριοποίηση και
επεξεργασία τους, αρκετά δύσκολη διαδικασία και είναι αντικείμενο μελέτης
στην επιστήμη των υπολογιστών, η οποία ερευνά και εξετάζει το θεωρητικό υπόβαθρο
και τη φύση των δεδομένων.\footnote{\href{https://w.wiki/H28}{\tl{https://el.wikipedia.org/wiki/}\tg{Επιστήμη\_υπολογιστών}}}
Μία αδιαμφισβήτητα μεγάλη πηγή, δεδομένων είναι τα κοινωνικά δίκτυα, στα οποία οι χρήστες επισκέπτονται και μοιράζονται δημόσια την άποψή τους για οτιδήποτε τους απασχολεί.
\section{Κοινωνικά δίκτυα}
Ο άνθρωπος από τη φύση τους έχει την τάση και την ανάγκη να αλληλεπιδρά και να επικοινωνεί με τους συνανθρώπους του, ανεξάρτητα της απόστασης, είτε αυτό ήταν σήματα καπνού, τηλέφωνο, αλληλογραφία κ.ο.κ.
Στη σημερινή εποχή, η ικανοποίηση αυτής της ανάγκης γίνεται με τη χρήση του διαδικτύου και τις διάφορες διαθέσιμες εφαρμογές όπως είναι τα κοινωνικά δίκτυα.
Τα κοινωνικά δίκτυα είναι πλατφόρμες που καθένας, με κάποιους περιορισμούς (π.χ ηλικιακούς), μπορεί να δημιουργήσει το ηλεκτρονικό του προφίλ. Το προφίλ αυτό περιέχει βασικές δημόσιες ή ημι-δημόσιες πληροφορίες για τον χρήστη όπως φωτογραφία, ημερομηνία γέννησης αλλά και δευτερεύουσες όπως χόμπι, ενδιαφέροντα, είδος ταινιών που προτιμάει κ.α.
Μετά τη δημιουργία της ηλεκτρονική τους ταυτότητα, οι πλέον χρήστες της εφαρμογής κοινωνικής δικτύωση μπορούν να αναζητήσουν άλλους χρήστες ώστε να γίνουν "φίλοι". Επιπλέον, δίνεται η δυνατότητα η συγγραφή και ο διαμοιρασμός από τον ένα χρήστη στον άλλον με τον οποίο μπορεί να διατηρεί "φιλική" σχέση ή αν το επιλέξει δημόσια σε όλους.
Η δημοτικότητα των κοινωνικών δικτύων στη σημερινή πραγματικότητα τόσο σε διεθνές όσο και σε ελληνικό επίπεδο είναι ιδιαίτερα υψηλή. Η έμφυτη ανάγκη επικοινωνίας του ατόμου με τους ομοίους του, έχει βρει διέξοδο στη σύγχρονη ηλεκτρονική κοινωνία μέσα από τα κοινωνικά δίκτυα, που αποτελούν πλέον μέρος μιας πραγματικότητας που θα φάνταζε απίθανη πριν από κάποια χρόνια. Και η ανάπτυξη αυτών των δικτύων μεγαλώνει μέρα με τη μέρα, ακολουθώντας τον σύγχρονο τρόπο ζωής.
Οι εφαρμογές κοινωνικής δικτύωσης στις ημέρες μας είναι πολλές και για να τις αναλύσουμε όλες θα χρειαζόντουσαν πολλές σελίδες. Παρακάτω θα αναφερθούμε περιεκτικά σε μερικά από τα διασημότερα.
\formattedpicture{users-by-social-media-platform}
{Αριθμός των ανθρώπων που χρησιμοποιούν εφαρμογές κοινωνικής δικτύωσης}
\subsection{\tl{Facebook}}
Το \tl{Facebook} δημιουργήθηκε στις 4 Φεβρουαρίου του 2004 και πλέον είναι το πιο δημοφιλές κοινωνικό δίκτυο σε όλο τον κόσμο. Οι χρήστες της πλατφόρμας μπορούν να συνδέονται μεταξύ τους ως φίλοι στο \tl{Facebook}, να ανταλλάσσουν μηνύματα και να έχουν πρόσβαση στις δημοσίευσης που γίνονται από τους φίλους τους. Οι ενεργοί χρήστες παγκοσμίως φτάνουν τους 1.66 δισεκατομμύρια σε καθημερινή βάση και 2.5 δισεκατομμύρια σε μηνιαία βάση.
\subsection{\tl{Youtube}}
Το \tl{Youtube} δημιουργήθηκε στις 14 Φεβρουαρίου του 2005 και έναν χρόνο μετά το 2006 αγοράστηκε από την \tl{Google}. Το \tl{Youtube} είναι ένας ιστότοπος στον οποίο οι χρήστες μπορούν να αναπαράγουν βίντεο, ταινιών και να ακούσουν μουσική. Αυτό που το έκανε τρομερά διάσημο ήταν ότι δίνει τη δυνατότητα στους εγγεγραμμένους χρήστες και ερασιτέχνες δημιουργούς να ανεβάζουν βίντεο και εάν το επιθυμούν να επωφελούνται οικονομικά με διαφημίσεις που προβάλλονται κατά τη διάρκεια προβολής τους. Οι μηνιαία ενεργοί χρήστες ξεπερνούν τα δύο δισεκατομμύρια.
\subsection{\tl{Twitter}}
Στα ένα από τα διασημότερα κοινωνικά δίκτυα συγκαταλέγεται και το \tl{Twitter}. Οι μηνιαίοι ενεργοί χρήστες είναι 330 εκατομμύρια και τα μηνύματα που δημιουργούν, τα οποία ονομάζονται \tl{tweets}, ανά ημέρα ξεπερνούν τα 500 εκατομμύρια. Στο \tl{Twitter} οι χρήστες μπορούν να ακολουθήσουν διαδικτυακά οποιοδήποτε άλλο χρήστη και να βλέπουν, σχολιάζουν και αναδημοσιεύουν οποιαδήποτε δημοσίευση κάνει.
Τα \tl{tweets} έχουν τα εξής χαρακτηριστικά:
\begin{itemize}
\item
Το μέγιστο μήκος του μηνύματος που επιτρέπει το \tl{Twitter} είναι 280 χαρακτήρες.
\item
Είναι δημόσια διαθέσιμα χρησιμοποιώντας το \tl{API}\footnote[1]{\href{https://developer.twitter.com/}{\tl{https://developer.twitter.com/}}} του \tl{Twitter}.
\end{itemize}
Σε αυτήν την εργασία θα ασχοληθούμε με την εξόρυξη γνώσης και της ανάλυσης συναισθήματος από μηνύματα του \tl{Twitter}.
%table
\begin{table}
\caption{Τα 10 δημοφιλέστερα Κοινωνικά Δίκτυα (Ιανουάριος 2020)}
\label{tbl:example}
\begin{center}
\begin{tabular}{|p{18mm}|p{45mm}|}\hline
& $Unique Monthly Visitors$ \\ \cline{1-2}
$\href{https://www.facebook.com/}{Facebook}$ & $2.200.000.000$\\ \cline{1-2}
$\href{https://www.youtube.com/}{Youtube}$ & $1.850.000.000$\\ \cline{1-2}
$\href{https://www.whatsapp.com/}{WhatsApp}$ & $1.500.000.000$\\ \cline{1-2}
$\href{https://www.instagram.com/}{Instagram}$ & $1.100.000.000$\\ \cline{1-2}
$\href{https://twitter.com/home}{Twitter}$ & $375.000.000$ \\ \cline{1-2}
$\href{https://gr.pinterest.com/}{Pinterest}$ & $250.000.000$ \\ \cline{1-2}
$\href{https://www.reddit.com/}{Reddit}$ & $370.000.000$ \\ \cline{1-2}
$\href{https://ask.fm/}{Ask.fm}$ & $105.000.000$ \\ \cline{1-2}
$\href{https://www.tumblr.com/}{Tumblr}$ & $95.000.000$ \\ \cline{1-2}
$\href{https://www.flickr.com/}{Flickr}$ & $90.000.000$ \\ \hline
\end{tabular}
\end{center}
\end{table}
\section{Ανάλυση δεδομένων}
Η ανάλυση δεδομένων είναι μια διαδικασία συλλογής (παρατήρηση, απόκτηση), επεξεργασίας (καθαρισμός, μετατροπή) και μοντελοποίησης των δεδομένων με στόχο την εξεύρεση χρήσιμης πληροφορίας για την υποστήριξη διαφόρων ειδών λήψεων αποφάσεων (\tl{decision-making}). Στο αρχικό στάδιο της ανάλυσης δεδομένων μας αφορά οι εύρεση πηγών που θα καταναλώσουμε τα δεδομένα, επομένως πρέπει να είναι πηγές με δεδομένα σχετικά με το ζήτημα που χρειάζεται να ληφθεί μια απόφαση π.χ. δεδομένα που αφορούν το αμερικάνικο μπάσκετ ο οργανισμός του \tl{NBA}\footnote[1]{\href{http://data.nba.net/}{\tl{http://data.nba.net/}}} είναι μια καλή πηγή. Από την άλλη, εάν μας ενδιαφέρει η κοινή γνώμη για ένα θέμα τα κοινωνικά δίκτυα αποτελούν την καλύτερη πηγή.
\subsection{Ανάλυση συναισθήματος}
Η ανάλυση συναισθήματος ορίζεται ως μια τεχνική ταξινόμησης κειμένου που αναλαμβάνει τη διεξαγωγή πληροφοριών για το συναισθηματικό ύφος του συγγραφέα από το γραπτό του λόγο. Χρησιμοποιώντας τεχνικές επεξεργασίας φυσικού λόγου (\tl{NLP}), στατιστικές μεθόδους και μεθόδους μηχανικής μάθησης για την ταξινόμηση ενός κειμένου σε κλάσεις που εκφράζουν συναίσθημα.
Η εξόρυξη και η διαχείριση γνώμης έχει πολλές εφαρμογές, όπως τον εντοπισμού κριτικών για ένα προϊόν ή την παρακολούθηση τις μεταβαλλόμενες στάσεις που έχει το κοινό απέναντι σε ένα πολιτικό πρόσωπο.
\formattedpicture{sentiment-analysis-approaches}
{Προσεγγίσεις ανάλυσης συναισθήματος}
Ένας αρχικός διαχωρισμός της ανάλυσης συναισθήματος γίνεται με βάση την ακριβή έννοια της συναισθηματικής κατάστασης που επιχειρεί να προσδιορίσει η οποία μπορεί να αναφέρεται απευθείας στη γενικότερη συναισθηματική κατάσταση του συγγραφέα κατά τη συγγραφή του κειμένου (\tl{affective state}), είτε στο συναίσθημα που μεταδίδεται σκόπιμα από τον συγγραφέα στον αναγνώστη μέσω του κειμένου, είτε στη στάση - άποψη - εκτίμηση του συγγραφέα σχετικά με κάποιο θέμα. Στις δύο πρώτες καταστάσεις μπορεί να γίνει ταξινόμηση σε συναισθήματα που είναι πιο εύκολα αντιληπτά στον άνθρωπο όπως είναι η χαρά, η λύπη, ο θυμός και άλλα. Τέλος, στην τελευταία περίπτωση όπου ο συγγραφέας ασχολείται εκφράζει την άποψή του για το ζήτημα που ασχολείται, η ταξινόμηση γίνεται συνήθως σε γενικότερες κλάσεις συναισθημάτων ως θετικά, αρνητικά ή ουδέτερα.
\section{Η εφαρμογή}
Η εφαρμογή που δημιουργήθηκε ασχολείται μην την εξόρυξη δεδομένων από το κοινωνικό δίκτυο \tl{Twitter} χρησιμοποιώντας το \tl{Search API}, το οποίο μας επιτρέπει να αναζητήσουμε προγραμματιστικά \tl{tweets} με τις λέξεις κλειδιά που επιθυμούμε, και ύστερα τα οπτικοποιούμε στο βιντεοπαιχνίδι \tl{Minecraft}\footnote[1]{\href{https://www.minecraft.net/}{\tl{https://www.minecraft.net/}}}. Ο ρόλος του \tl{mod} είναι να χτίζει τυχαίες παραχθείσες και αληθοφανής πόλης στον εικονικό κόσμο του \tl{Minecraft}. Συνεχίζοντας, στο επόμενο κεφάλαιο θα δοθούν πληροφορίες σχετικά με το παιχνίδι και διάφορες θεωρητικές γνώσεις που θα χρειαστούν για την ορθότερη κατανόηση της εφαρμογής.