ChatGPT, το μέλλον του AI

Το ChatGPT by OpenAI (Generative Pre-trained Transformer) είναι ένα chatbot που κυκλοφόρησε από την OpenAI τον Νοέμβριο του 2022. Είναι χτισμένο πάνω από την οικογένεια μεγάλων γλωσσικών μοντέλων GPT-3.5 του OpenAI και είναι βελτιστοποιημένο τόσο με εποπτευόμενες όσο και με ενισχυτικές τεχνικές εκμάθησης.

Το ChatGPT κυκλοφόρησε ως πρωτότυπο στις 30 Νοεμβρίου 2022 και γρήγορα τράβηξε την προσοχή για τις λεπτομερείς απαντήσεις και τις αρθρωμένες απαντήσεις του σε πολλούς τομείς γνώσης. Η ανομοιόμορφη πραγματική του ακρίβεια αναγνωρίστηκε ως σημαντικό μειονέκτημα.

Chat GPT By OpenAI

Ενώ η βασική λειτουργία ενός chatbot είναι να μιμείται έναν άνθρωπο συνομιλητή, οι δημοσιογράφοι έχουν επίσης σημειώσει την ευελιξία και τις δεξιότητες αυτοσχεδιασμού του ChatGPT, συμπεριλαμβανομένης της ικανότητάς του να γράφει και να διορθώνει προγράμματα υπολογιστών. να συνθέτει μουσική, τηλεπαιχνίδια, παραμύθια και δοκίμια μαθητών· να απαντά σε ερωτήσεις τεστ (μερικές φορές, ανάλογα με το τεστ, σε επίπεδο πάνω από τον μέσο άνθρωπο που κάνει τεστ), να γράφει ποίηση και στίχους τραγουδιών, να μιμείται ένα σύστημα Linux. για προσομοίωση ολόκληρης αίθουσας συνομιλίας. για να παίξετε παιχνίδια όπως tic-tac-toe? και για την προσομοίωση ενός ΑΤΜ. Σε σύγκριση με τον προκάτοχό του, το InstructGPT, το ChatGPT προσπαθεί να μειώσει τις επιβλαβείς και δόλιες απαντήσεις. Τα ταξίδια του Κολόμβου και οι πληροφορίες για τον σύγχρονο κόσμο – συμπεριλαμβανομένων των αντιλήψεων για τον Κολόμβο για την κατασκευή μιας απάντησης που υποθέτει τι θα συνέβαινε εάν ο Κολόμβος ερχόταν στις ΗΠΑ το 2015.Τα δεδομένα εκπαίδευσης του ChatGPT περιλαμβάνουν σελίδες man και πληροφορίες σχετικά με φαινόμενα του Διαδικτύου και γλώσσες προγραμματισμού, όπως συστήματα πίνακα ανακοινώσεων και τη γλώσσα προγραμματισμού Python.

Το ChatGPT βελτιστοποιήθηκε πάνω από το GPT-3.5 χρησιμοποιώντας εποπτευόμενη μάθηση καθώς και ενισχυτική μάθηση. Και οι δύο προσεγγίσεις χρησιμοποίησαν ανθρώπινους εκπαιδευτές για να βελτιώσουν την απόδοση του μοντέλου. Στην περίπτωση της εποπτευόμενης μάθησης, στο μοντέλο παρασχέθηκαν συνομιλίες στις οποίες οι εκπαιδευτές έπαιξαν και τις δύο πλευρές: ο χρήστης και ο βοηθός τεχνητής νοημοσύνης. Στο βήμα ενίσχυσης, οι ανθρώπινοι εκπαιδευτές κατέταξαν πρώτα τις απαντήσεις που είχε δημιουργήσει το μοντέλο σε μια προηγούμενη συνομιλία. Αυτές οι ταξινομήσεις χρησιμοποιήθηκαν για τη δημιουργία «μοντέλων ανταμοιβής» στα οποία το μοντέλο βελτιστοποιήθηκε περαιτέρω χρησιμοποιώντας αρκετές επαναλήψεις του Proximal Policy Optimization (PPO).Οι αλγόριθμοι βελτιστοποίησης εγγύς πολιτικής παρουσιάζουν ένα οικονομικά αποδοτικό όφελος από τους αλγόριθμους βελτιστοποίησης της πολιτικής περιοχής εμπιστοσύνης. αναιρούν πολλές από τις υπολογιστικά ακριβές λειτουργίες με ταχύτερη απόδοση. Τα μοντέλα εκπαιδεύτηκαν σε συνεργασία με τη Microsoft στην υπερυπολογιστική τους υποδομή Azure. Επιπλέον, το OpenAI συνεχίζει να συλλέγει δεδομένα από χρήστες του ChatGPT που θα μπορούσαν να χρησιμοποιηθούν για την περαιτέρω εκπαίδευση και βελτίωση του ChatGPT. Οι χρήστες επιτρέπεται να υπερψηφίζουν ή να αρνούνται τις απαντήσεις που λαμβάνουν από το ChatGPT. όταν ψηφίσουν θετικά ή αρνητικά, μπορούν επίσης να συμπληρώσουν ένα πεδίο κειμένου με πρόσθετα σχόλια.

Chat GPT By OpenAI

Credits: OpenAI Source: Wikipedia