Η Βικιπαίδεια, συχνά, κατακρίνεται για την αξιοπιστία της, παρόλα αυτά παραμένει μία από τις διασημότερες πηγές γνώσης στον κόσμο. Σύμφωνα, με τωρινά δεδομένα, η διαδικτυακή εγκυκλοπαίδεια βρίσκεται στην 5η θέση στην κατηγορία των ιστοτόπων που “επισκέπτονται” οι χρήστες (προηγούνται το Google, το Youtube, το Facebook και το Baidu). Τα λήμματά της δημιουργούνται και επεξεργάζονται σε περίπου 300 διαφορετικές γλώσσες και σύμφωνα με πρόσφατη μέτρηση περιέχει πάνω από 48.000.000 άρθρα, διαφορετικής και ποικίλης θεματολογίας.
Η Βικιπαίδεια, προσφέρει τη δυνατότητα δημιουργίας και επεξεργασίας των λημμάτων της, ακόμη, και από ανώνυμους χρήστες. Οι χρήστες δεν χρειάζεται να αποδείξουν τις ικανότητες, την εκπαίδευση ή/και την εμπειρία τους. Ακόμη, η απουσία μιας κεντρικής ομάδας επεξεργασίας ή μιας ομάδας αναγνωστών, αρμόδιας για τον συστηματικό έλεγχο των νέων λημμάτων, είναι ένας επιπλέον λόγος για τον οποίο ασκείται κριτική στη Βικιπαίδεια, και συγκεκριμένα θεωρείται ως αναξιόπιστη πηγή πληροφοριών. Αντιθέτως, υπάρχει η δυνατότητα άντλησης χρήσιμων πληροφοριών, ανάλογα το θέμα και τη γλώσσα. Πρακτικά, υπάρχει σύστημα απονομής βραβείου για τα καλύτερα λήμματα, σε κάθε γλώσσα. Ο αριθμός, βέβαια, των λημμάτων που έχουν βραβευθεί είναι μικρός (μικρότερος από 1%). Επομένως, στα περισσότερα λήμματα (ειδικά σε κάποιες γλώσσες πάνω από το 99%), δεν υπάρχει τρόπος αξιολόγησης και είναι στην προσωπική ευκαίρια κάθε αναγνώστη να αξιοποιήσει τις πληροφορίες. Αξιοσημείωτο, όμως, είναι ότι η προσωπική αξιοποίηση/κριτική των λημμάτων των επιστημονικών κλάδων, είναι παγκοσμίως γνωστή. Η επεξεργασία των επιστημονικών λημμάτων αποτελεί την πλήρης ανεπτυγμένη θεματολογία στη Βικιπαίδεια, με σημαντική συνεισφορά στην Αγγλική, που ήδη περιέχει πάνω από 5,5 εκατομμύρια λήμματα. Από την ίδρυση της και την μετέπειτα αναγνώρισή της, συνεχώς απασχολεί το γεγονός της πληθώρας των επιστημονικών λημμάτων. Μία από τις πρώτες έρευνες που διεξήχθησαν, έδειξε ότι τα επιστημονικά λήμματα βοηθούν να περιοριστεί η κριτική στην αξιοπιστία των πληροφοριών της, καθώς τα λήμματα αυτά, αξιολογούνται βάση των πολλών αναφορών σε πηγές και έχουν δεχθεί πολλαπλές επεξεργασίες από πολλούς χρήστες.
Το βασικό ερώτημα που πρέπει να τεθεί εδώ είναι το πώς έχουν αντληθεί οι πληροφορίες αυτές, η απάντηση είναι ότι συγκρίνονται τα αξιόπιστα λήμματα με τα μη-αξιόπιστα. Όπως προαναφέρθηκε, σχεδόν σε κάθε εκδοχή της Βικιπαίδειας, υπάρχει σύστημα αξιολόγησης των λημμάτων. Τα καλύτερα λήμματα βραβεύονται, με το να τοποθετείται στην σελίδα του λήμματος ένα ειδικό “σήμα”. Στη Ρωσική Βικιπαίδεια, λόγου χάρη, τα βραβευμένα λήμματα ονομάζονται “Featured Articles (FA)” και για τα λιγότερο αξιόπιστα λήμματα, υπάρχει διαφορετικό “σήμα”, το “Good Articles (GA)“. Σε κάποιες άλλες γλώσσες, υπάρχουν και “σήματα” για άλλες διαβαθμίσεις αξιοπιστίας. Στην Αγγλική Βικιπαίδεια, λόγου χάρη, υπάρχουν τα “σήματα”: A-class, Β-class, C-class, Start, Stub ενώ στη Ρώσικη υπάρχουν τα αντίστοιχα: Solid, Full, Developed, In Development, Stub. Ακόμη, σύμφωνα με τα παραδείγματα, συμπεραίνεται ότι τα κριτήρια αξιολόγησης διαφέρουν αναλόγως τη γλωσσική εκδοχή της Βικιπαίδειας καθώς υπάρχουν γλωσσικές εκδοχές οι οποίες δεν έχουν παρόμοιο σύστημα αξιολόγησης. Η Γερμανική Βικιπαίδεια, λόγου χάρη, η οποία περιέχει πάνω από 2 εκατομμύρια λήμματα, έχει δύο κλίμακες αξιολόγησης, τα (FA) και τα (GA), με αποτέλεσμα τα λήμματα της να κατηγοριοποιούνται ως εξής: Α) “Complete“- FA και GA Β) “Incomplete“- όλα τα υπόλοιπα λήμματα. Το σύστημα αυτό, αποκαλείται δυαδικό (1-Complete Articles, 0-Incomplete Articles), και πιθανώς να έχει αμφισβητούμενα όρια μεταξύ των κλιμάκων αλλά επιτρέπει την σύγκριση λημμάτων με διαφορετικές γλωσσικές εκδοχές της Βικιπαίδειας.
Για τη δημιουργία αυτών των μοντέλων αξιοπιστίας, γίνεται χρήση του Data Mining και πιο συγκεκριμένα, ενός από τους πιο γνωστούς αλγορίθμους, το Random Forest. Υπάρχουν έρευνες που τον συγκρίνουν με άλλους αλγόριθμους όπως τους CART, SMO, Multilayer Perceptron, LMT, C4.5, C5.0. Ο Random Forest επιτρέπει την δημιουργία μοντέλων ακόμη και με τη χρήση μεταβλητών που συσχετίζονται και δείχνει ποιες μεταβλητές είναι πιο σημαντικές για την αξιολόγηση των λημμάτων. Σε περίπτωση, όμως, που κρίνεται απαραίτητη η λήψη διαφορετικών πληροφοριών σχετικά με την σπουδαιότητα των μεταβλητών, γίνεται χρήση άλλων αλγορίθμων, συμπεριλαμβανομένου του μοντέλου λογιστικής παλινδρόμησης. Τα αποτελέσματα, αποδεικνύουν ότι υπάρχουν διαφορές στην αξιοπιστία των μοντέλων που χρησιμοποιούν οι γλωσσικές εκδοχές της Βικιπαίδειας. Αν σε κάποια γλωσσική εκδοχή, λόγου χάρη, η πιο σημαντική παράμετρος είναι ο αριθμός των παραπομπών, σε κάποια άλλη εκδοχή μπορεί να είναι η ενσωμάτωση εικόνων ή/και η έκταση του λήμματος. Σε αυτή την περίπτωση, η αξιοπιστία έγκειται στην κατηγοριοποίηση των λημμάτων σε δύο: Complete ή Incomplete. Η κατηγοριοποίηση γίνεται βάση διαφόρων κριτηρίων όπως η έκταση του λήμματος, ο αριθμός των παραπομπών, οι εικόνες, οι ενότητες, οι εξωτερικοί σύνδεσμοι, ο αριθμός δεδομένων, η επισκεψιμότητα, ο αριθμός των επεξεργασιών και πολλά άλλα. Υπάρχουν, ακόμη, γλωσσολογικά κριτήρια τα οποία διαφέρουν από γλωσσική εκδοχή σε γλωσσική εκδοχή. Πρόσφατα, μετρήθηκαν συνολικά πάνω από 300 παράμετροι που χρησιμοποιούνται σε έρευνες που σχετίζονται με τις γλωσσικές εκδοχές της Βικιπαίδειας και της πολυπλοκότητας των αξιολογικών μοντέλων. Μερικοί παράμετροι, όπως οι παραπομπές (πηγές), μπορούν να αναλογιστούν ως πρόσθετοι καθώς είναι μετρήσιμες όχι μόνο για την αξιοπιστία αλλά και για την χρησιμότητα των πηγών στη δημιουργία λημμάτων της Βικιπαίδειας. Οι παράμετροι αναφέρονται στη Βικιπαίδεια, στο API service, σε special tools και σε άλλες πηγές. Για την χρήση τους, απαιτείται μόνο να σταλθεί αίτημα στο αντίστοιχο API, για άλλες όμως παραμέτρους και ειδικά για γλωσσολογικές πρέπει να χρησιμοποιηθούν special libraries και parsers. Τις περισσότερες, όμως, φορές έχει παρατηρηθεί ότι γίνεται χρήση προσωπικών εργαλείων τα οποία τοποθετεί ο χρήστης.
Σε σύγχρονες έρευνες, καταληκτικά, έχει προταθεί η μέθοδος αξιολόγησης των λημμάτων σε κλίμακα από 0-100. Με αυτό το τρόπο, ένα λήμμα, μπορεί να αξιολογηθεί με 54,21. Η μέθοδος αυτή έχει ελεγχθεί σε 55 γλωσσικές εκδοχές και τα αποτελέσματα είναι διαθέσιμα στην WikiRank, η οποία επιτρέπει την αξιολόγηση και σύγκριση της ποιότητας και της επισκεψιμότητας των λημμάτων σε διαφορετικές γλώσσες. Η μέθοδος, φυσικά, δεν είναι ιδανική αλλά είναι λειτουργική για θεματολογία γνωστή στο ευρύ κοινό. Ένας ακόμη τρόπος αξιολόγησης των λημμάτων, είναι από το αποκαλούμενο “infobox”, το οποίο βρίσκεται πάνω δεξιά στο λήμμα και απεικονίζει τα πιο σημαντικά δεδομένα του θέματος. Με αυτό το τρόπο, αποφεύγεται η ανάγνωση όλων των πληροφοριών του λήμματος. Υπάρχουν σχετικά πρότζεκτ, όπως το Infoboxes.net, που παρέχει τη δυνατότητα αυτόματης σύγκρισης των infoboxes σε διαφορετικές γλωσσικές εκδοχές.
Γίνεται σαφές από τα παραπάνω, λοιπόν, ότι η αξιοπιστία των πληροφοριών της Βικιπαίδειας δεν είναι πάντοτε ελέγξιμη. Οι προαναφερθείσες μέθοδοι, όμως, απλοποιούν τη διαδικασία, αν το λήμμα είναι αναξιόπιστο, τότε ο αναγνώστης, που το αντιλαμβάνεται, έχει την ικανότητα να τις χρησιμοποιήσει για να αντλήσει τις πληροφορίες που τον ικανοποιούν. Ακόμη, ο χρήστης έχει την ικανότητα να αναζητήσει το λήμμα που επιθυμεί σε διαφορετική γλωσσική εκδοχή και, με τις σύγχρονες εκδοχές, να μεταφέρει τις πληροφορίες από τη μια γλωσσική εκδοχή σε κάποια άλλη. Με αυτό το τρόπο, επιτυγχάνεται ο εμπλουτισμός των μη αξιόπιστων λημμάτων με πληροφορίες από άλλες αξιόπιστες γλωσσικές εκδοχές καθώς και βελτιώνει την ποιότητα άλλων δευτερευόντων databases, που η Βικιπαίδεια είναι η κύρια πηγή πληροφοριών, όπως το DBpedia, το Wikidata και το YAGO2.