![]() |
Το λ?μμα παραθ?τει τι? πηγ?? του α?ριστα, χωρ?? παραπομπ??. |
![]() |
Αυτ? το λ?μμα χρει?ζεται μετ?φραση.
Αν θ?λετε να συμμετ?σχετε, μπορε?τε να επεξεργαστε?τε το λ?μμα μεταφρ?ζοντ?? το ? προσθ?τοντα? δικ? σα? υλικ? και να αφαιρ?σετε το {{μετ?φραση}} μ?λι? το ολοκληρ?σετε. Ε?ναι πιθαν? (και επιθυμητ?) το ξεν?γλωσσο κε?μενο να ?χει κρυφτε? σαν σχ?λιο με τα <!-- και -->. Πατ?στε "επεξεργασ?α" για να δε?τε ολ?κληρο το κε?μενο. |

Στου? υπολογιστ??, το διεθν?? πρ?τυπο Unicode στοχε?ει στην κωδικοπο?ηση ?λων των συστημ?των γραφ?? που χρησιμοποιο?νται στον πλαν?τη, ?στε να γ?νει δυνατ? η αποθ?κευση -στη μν?μη εν?? υπολογιστ?- γραπτο? κειμ?νου ?λων των γλωσσ?ν συμπεριλαμβανομ?νων και συμβ?λων επιστημ?ν, ?πω? μαθηματικ?, φυσικ? κτλ.
Η καθι?ρωση του Unicode ε?ναι ?να φιλ?δοξο σχ?διο αφο? σκοπε?ει να αντικαταστ?σει ?λε? τι? υπ?ρχουσε? κωδικοποι?σει? συν?λων χαρακτ?ρων, οι οπο?ε? ?χουν περιορισμο?? που τι? καθιστο?ν προβληματικ?? για χρ?ση σε πολυγλωσσικ? υπολογιστικ? συστ?ματα.
Παρ? τα τεχνικ? προβλ?ματα που ?χουν παρουσιαστε? το Unicode ?χει καθιερωθε? ω? το πιο πλ?ρε? σ?νολο χαρακτ?ρων και ω? η προτιμ?τερη κωδικοπο?ηση σε πολυγλωσσικ? λογισμικ?. Πολλ? πρ?σφατα πρ?τυπα ?πω? το XML, καθ?? και λογισμικ? συστ?ματο? ?πω? λειτουργικ? συστ?ματα, ?χουν υιοθετ?σει το Unicode για να αναπαριστο?ν εσωτερικ? κε?μενο.
Γ?ννηση και αν?πτυξη του προτ?που
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Το πρ?τυπο Unicode ε?χε τον ρητ? στ?χο να ξεπερ?σει του? περιορισμο?? των παλαι?τερων ("παραδοσιακ?ν") προτ?πων για κωδικοπο?ηση χαρακτ?ρων ?πω? για παρ?δειγμα το ISO 8859 πρ?τυπο, το οπο?ο χρησιμοποι?θηκε ευρ?ω? σε πολλ?? χ?ρε? στον κ?σμο, αλλ? παρουσ?αζε προβλ?ματα ασυμβατ?τητα? μεταξ? των διαφορετικ?ν υλοποι?σε?ν του. Γενικ?, πολλ? παλαι?τερα πρ?τυπα για κωδικοπο?ηση χαρακτ?ρων μοιρ?ζονται ?να κοιν? πρ?βλημα: το ?τι επιτρ?πουν υποστ?ριξη μονο δ?ο αλφαβ?των σε ?να συγκεκριμ?νο υπολογιστ?, συν?θω? του Λατινικο? και εν?? τοπικο?, δηλαδ? δεν υποστηρ?ζουν πολλ? αλφ?βητα στον ?διο υπολογιστ?. Για παρ?δειγμα, οσον αφορ? το πρ?τυπο ISO 8859, ?να? υπολογιστ?? στην Ελλ?δα ε?ναι (συν?θω?) ρυθμισμ?νο? να υποστηρ?ζει μονο το Λατινικ? και το Ελληνικ? αλφ?βητο για κε?μενο κωδικοποιημ?νο κατ? ISO 8859. ?τσι, η αν?γνωση κειμ?νου (κωδικοποιημ?νου κατ? ISO 8859) που περι?χει κ?ποιο ?λλο αλφ?βητο (?πω? για παρ?δειγμα Ρ?σικο, Εβρα?κ? κλπ) θα ε?ναι προβληματικ? σε Ελληνικ? υπολογιστ?, αφο? οι (Ρωσικο?, Εβρα?κο? κλπ) χαρακτ?ρε? δεν θα εμφαν?ζονται σωστ?. Αυτ? συμβα?νει για το πρ?τυπο ISO 8859 χρησιμοποιε? μ?νο 8 bit για να κωδικοποι?σει κ?θε χαρακτ?ρα (δηλαδ?, συνολικ? μπορο?με να αναπαραστ?σουμε μονο 256 διαφορετικο?? χαρακτ?ρε?). Οι πρ?τε? 128 θ?σει? δεσμε?ονται για το Λατινικ? αλφ?βητο και μερικ? σ?μβολα, εν? οι υπ?λοιπε? 128 για το τοπικ? μη-Λατινογεν?? αλφ?βητο (?ποιο και αν ε?ναι αυτ? Ελληνικ?, Ρ?σικο, Εβρα?κ? κλπ). ?τσι πρακτικ?, οι χαρακτ?ρε? των μη-λατινογεν?ν αλφ?βητων "μοιρ?ζονται" τι? ?διε? θ?σει? με του? χαρακτ?ρε? κ?ποιου ?λλου μη-λατινογενο?? αλφαβ?του, και ?ρα δεν μπορο?ν να υποστηρ?ζονται ταυτ?χρονα απ? το σ?στημα (δεν ε?ναι δυνατ?ν μια θ?ση να αντιστοιχε? σε π?νω απ? ?ναν χαρακτ?ρε?).
Το Unicode μετατρ?πει κ?θε χαρακτ?ρα σε ?να κωδικ? σημε?ο ("θ?ση/τιμ? κ?δικα"), χρησιμοποι?ντα? ?ω? και 16 bit αν? χαρακτ?ρα το οπο?ο εξασφαλ?ζει ?τι ?λοι οι χαρακτ?ρε? μπορο?ν να υποστηρ?ζονται απ? ?λα τα υπολογιστικ? συστ?ματα. Το unicode δεν κωδικοποιε? τη μορφοπο?ηση του κειμ?νου (στυλ/γραμματοσειρ?/μ?γεθο? κλπ).Το πρ?τυπο Unicode αφ?νει το αν?λογο λογισμικ? (πλοηγ?? Διαδικτ?ου, επεξεργαστ?? κειμ?νου) να εφαρμ?σει την οπτικ? αναπαρ?σταση (στυλ, μ?γεθο?, γραμματοσειρ?) των χαρακτ?ρων.
Επ?ση? στο πρ?τυπο περιλαμβ?νει και σχετικ? θ?ματα ?πω? ιδι?τητε? χαρακτ?ρων, φ?ρμε? κανονικοπο?ηση? κειμ?νου,κατε?θυνση εμφ?νιση?(για γλ?σσε? που διαβ?ζονται και απ? τα δεξι? προ? τα αριστερ? ?πω? η Αραβικ? γλ?σσα και τα Εβρα?κ?.
Αλφ?βητα που περιλαμβ?νονται
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Το Unicode περιλαμβ?νει σχεδ?ν ?λα τα συστ?ματα γραφ?? που ε?ναι σε χρ?ση σ?μερα. Αυτ? ε?ναι τα:
και ?λλα |
Το Unicode ?χει προσθ?σει και ?λλα αλφ?βητα ?πω? ιστορικ? αλφ?βητα και εξαφανισμ?να αλφ?βητα για ακαδημα?κο?? λ?γου?:
... |
Επ?ση? περιλαμβ?νει και ?λλα σ?μβολα που χρησιμοποιο?νται στα μαθηματικ? και την μουσικ?.
Δι?φορα
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Το 1997 Μ?χαελ ?βερσον πρ?τεινε να κωδικοποιηθο?ν και οι χαρακτ?ρε? τη? φανταστικ?? Κλ?νγκον γλ?σσα? στο Επ?πεδο 1 του ISO/IEC 10646-2. Αλλ? η πρ?ταση αυτ? απορρ?φθηκε ?πω? και η πρ?ταση για συμπερ?ληψη γλωσσ?ν του Τ?λκιν.
Κωδικοποι?σει?
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Πρ?τυπα
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Η κοινοπραξ?α Unicode με ?δρα την Καλιφ?ρνια, αναπτ?σσει το πρ?τυπο Unicode. Οποιαδ?ποτε οργ?νωση ? ιδι?τη? μπορε? να γ?νει μ?λο? τη? εφ?σον πληρ?σει συνδρομ?. Στα μ?λη συμπεριλαμβ?νονται σχεδ?ν ?λε? τι? μεγ?λε? εταιρε?ε? λογισμικο? και υλικο? που ενδιαφ?ρονται σχετικ? ?πω? οι Apple, Microsoft, IBM, Xerox, HP, Adobe Systems και πολλ?? ?λλε?.
Η κοινοπραξ?α δημοσ?ευσε πρ?τη φορ? Το πρ?τυπο Unicode (ISBN 0-321-18578-1) το 1991,και συνεχ?ζει να αναπτ?σσει πρ?τυπα βασισμ?να στην αρχικ? αυτ? εργασ?α. Η κοινοπραξ?α Unicode αναπτ?χθηκε σε συνδυασμ? με τον Διεθν? Οργανισμ? Τυποπο?ηση? ISO, και το πρ?τυπ? τη? μοιρ?ζεται το σ?νολο χαρακτ?ρων τη? με το πρ?τυποISO/IEC 10646. Το Unicode και το ISO/IEC 10646 ε?ναι ισοδ?ναμα ω? κωδικοποι?σει? χαρακτ?ρων αλλ? το Unicode περι?χει πολ? περισσ?τερε? πληροφορ?ε? για προγραμματιστ?? που το υλοποιο?ν, καλ?πτοντα? σε β?θο? θ?ματα ?πω? κωδικοπο?ηση βασισμ?νη σε μπιτ, Unicode collation αλγ?ριθμοι, και γραφικ? απ?δοση. Το Unicode απαριθμε? αρκετ?? ιδι?τητε? χαρακτ?ρων, περιλαμβ?νοντα? και αυτ?? που χρει?ζονται για BiDi υποστ?ριξη. Τα δυο πρ?τυπα χρησιμοποιο?ν μερικ?? διαφορετικ? ορολογ?α.
?ταν γρ?φουμε για κωδικ? σημε?α του Unicode ε?ναι σ?νηθε? να χρησιμοποιο?με τη μορφ? U+xxxx or U+xxxxxx ?που xxxx ? xxxxxx ε?ναι το κωδικ? σημε?ο στο δεκαεξαδικ? σ?στημα.
Unicode ιστορικ? αναθεωρ?σεων
[Επεξεργασ?α | επεξεργασ?α κ?δικα]- 1991 Unicode 1.0
- 1993 Unicode 1.1
- 1996 Unicode 2.0
- 1998 Unicode 2.1
- 1999 Unicode 3.0
- 2001 Unicode 3.1
- 2002 Unicode 3.2
- 2003 Unicode 4.0
- 2005 Unicode 4.1
Αποθ?κευση μεταφορ? και επεξεργασ?α
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Μ?χρι τ?ρα το Unicode παρουσι?στηκε απλ? ω? μια απεικ?νιση κ?θε χαρακτ?ρα που χρησιμοποιε?ται σε κ?ποιο αλφ?βητο στη Γη σε ?ναν μοναδικ? αριθμ?, το κωδικ? σημε?ο. ?μω? η αποθ?κευση αυτ?ν των αριθμ?ν κατ? την επεξεργασ?α κειμ?νου ε?ναι ?να εντελ?? διαφορετικ? θ?μα. Προβλ?ματα ανακ?πτουν απ? το γεγον?? ?τι το λογισμικ? που γρ?φεται στον δυτικ? κ?σμο χειρ?ζεται μ?νο κωδικοποι?σει? 8-bit με την unicode υποστ?ριξη να προστ?θεται πολ? αργ?τερα.
Η εσωτερικ? λογικ? παραδοσιακ?ν 8-μπιτ εφαρμογ?ν επιτρ?πει μ?νο 8 μπιτ? για κ?θε χαρακτ?ρα κ?νοντα? αδ?νατη τη χρησιμοπο?ηση περισσ?τερων των 256 κωδικ?ν σημε?ων χωρ?? ειδικ? επεξεργασ?α. ?τσι οι μηχανικο? λογισμικο? ?χουν προτε?νει δι?φορου? μηχανισμο?? για την υλοπο?ηση του Unicode. Ποια υλοπο?ηση χρησιμοποιε? ο κ?θε προγραμματιστ?? απ? θ?ματα χωρητικ?τητα?, συμβατ?τητα? πηγα?ου κ?δικα και διαλειτουργικ?τητα? με ?λλα συστ?ματα.
Το Unicode ορ?ζει δ?ο τρ?που? απεικ?νιση?:
- Τι? UTF (Unicode Transformation Format) κωδικοποι?σει?
- Και τι? UCS (Universal Character Set) κωδικοποι?σει?
Αυτ?? οι κωδικοποι?σει? περιλαμβ?νουν τι? εξ?? κ?ριε?:
(Ο αριθμ?? υποδηλ?νει τον αριθμ? των μπιτ? σε κ?θε μον?δα (για UTF κωδικοποι?σει?) ? byter αν? μον?δα (για UCS κωδικοποι?σει?).)
?τοιμοι και σ?νθετοι χαρακτ?ρε?
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Το Unicode περιλαμβ?νει ?να μηχανισμ? τροποπο?ηση? του σχ?ματο? των χαρακτ?ρων κι ?τσι επεκτε?νει το ρεπερτ?ριο των υποστηριζ?μενων γλυφ?ν. Αυτ? καλ?πτει τη χρ?ση συνδυαζ?μενων διακριτικ?ν χαρακτ?ρων. Αυτο? εισ?γονται μετ? τον κ?ριο χαρακτ?ρα (μπορε? κανε?? να σωρρε?σει περισσ?τερου? συνδυαζ?μενου? διακριτικο?? χαρακτ?ρε? στον ?διο χαρακτ?ρα). Ωστ?σο, για λ?γου? συμβατ?τητα?, το Unicode περιλαμβ?νει επ?ση? μια μεγ?λη ποσ?τητα απ? προσυντεθιμ?νου? χαρακτ?ρε?. ?τσι, σε πολλ?? περιπτ?σει?, οι χρ?στε? ?χουν στη δι?θεσ? του? πολλο?? τρ?που? κωδικοπο?ηση? του ?διου χαρακτ?ρα. Για να το αντιμετωπ?σει αυτ?, το Unicode παρ?χει τον μηχανισμ? των μετασχηματισμ?ν κανονικ?? ισοδυναμ?α?. Παρ?μοια κατ?σταση ισχ?ει και με το Hangul. Το Unicode παρ?χει τον μηχανισμ? σ?νθεση? συλλαβ?ν Hangul με το Hangul Jamo. Ωστ?σο, παρ?χει επ?ση? προσυντεθιμ?νε? συλλαβ?? Hangul (11,171 συλλαβ??)
Τα ιδεογρ?μματα CJK (Κ?να, Ιαπων?α, Κορ?α) ?χουν επ? του παρ?ντο? κ?δικε? μ?νο για την προσυντεθιμ?νη μορφ? του?. Ακ?μα ?μω?, τα περισσ?τερα απ? αυτ? τα ιδεογραφ?ματα τελικ?? αποτελο?νται απ? απλο?στερα στοιχε?α, ?τσι, κατ' αρχ?ν το Unicode μπορε? να τα αποσυνθ?σει ?πω? συμβα?νει με τα Hangul. Αυτ? θα με?ωνε σε μεγ?λο βαθμ? τον αριθμ? των απαιτο?μενων κωδικ?ν σημε?ων, εν? ταυτ?χρονα επιτρ?πει την εμφ?νιση στην πραγματικ?τητα κ?θε νοητο? ιδεογραφ?ματο? (καταργ?ντα? ?τσι τα προβλ?ματα τη? Han unification) Μια παρ?μοια ιδ?α καλ?πτει ορισμ?νε? μεθ?δου? εισαγωγ?? ?πω? η μ?θοδο? Cangjie και Wubi. Ωστ?σο, οι προσπ?θειε? να γ?νει αυτ? για κωδικοπο?ηση χαρακτ?ρων σκ?νταψαν π?νω στο γεγον?? ?τι τα ιδεογραφ?ματα δεν αποσυντ?θενται τ?σο απλ? ? τ?σο κανονικ? ?σο δε?χνουν.
Οι συνδυαζ?μενοι χαρακτ?ρε?, ?πω? η περ?πλοκη μορφοπο?ηση του script που απαιτε?ται για να αποδ?σει κανε?? σωστ? ?να Αραβικ? κε?μενο και πολλ? ?λλα scripts, συχν? εξαρτ?νται απ? περ?πλοκε? τεχνολογ?ε? γραμματοσειρ?ν, ?πω? η Open Type (απ? την Adobe και τη Microsoft), την Graphite (απ? την SIL International) και την Apple Advanced Typography AAT (απ? την Apple Computer), μ?σω τη? οπο?α? ο σχεδιαστ?? γραμματοσειρ?? περιλαμβ?νει οδηγ?ε? σε ?να λογισμικ? δημιουργ?α? γραμματοσειρ?ν για το πω? θα παρ?γει διαφορετικ?? σειρ?? χαρακτ?ρων. Μια ?λλη μ?θοδο? που χρησιμοποιε?ται σε γραμματοσειρ?? με σταθερ? πλ?το? ε?ναι να τοποθετε?ται το σ?μβολο του συνδυαζ?μενου χαρακτ?ρα πριν τα δεξι? του (sidebearing). Αυτ? η μ?θοδο?, ωστ?σο, λειτουργε? μ?νο για ορισμ?να διακριτικ? και η σ?ρρευση δεν θα γ?νει σωστ?.
Μ?χρι και το 2004, τα περισ?τερα λογισμικ? ακ?μα δεν μπορο?σαν να χειριστο?ν αξι?πιστα πολλ? χαρακτηριστικ? που δεν υποστηρ?ζονταν απ? παλαι?τερε? τυποποι?σει? γραμματοσειρ?ν, ?τσι το να συνδυ?ζει κανε?? χαρακτ?ρε?, γενικ?? δεν λειτουργο?σε σωστ?. Υποθετικ?, το ? (προσυντεθιμ?νο e με περισπωμ?νη και οξε?α) και το ? (e που ακολουθε?ται απ? συνδυαζ?μενη περισπωμ?νη επ?νω και συνδυαζ?μενη οξε?α επ?νω) ε?ναι πανομοι?τυπα στην εμφ?νιση, δ?νοντα? και τα δ?ο ?να e με περισπωμ?νη και οξε?α, αλλ? η εμφ?νιση μπορε? να διαφοροποιε?ται σε μεγ?λο βαθμ? κατ? την εφαρμογ? εφαρμογ?ν λογισμικο?.
Επ?ση?, οι κ?τω τελε?ε?, οι οπο?ε? χρει?ζονται στα Ινδικ? Romanization, συχν? θα τοποθετο?νται λανθασμ?να ? ακ?μα χειρ?τερα. Παρ?δειγμα:
- ? - ? - ?
Β?βαια, αυτ? δεν ε?ναι στην πραγματικ?τητα μια αδυναμ?α του ?διου του Unicode, αλλ? απλ?? αποκαλ?πτει κεν? τη? τεχνολογ?α? απ?δοση? και των γραμματοσειρ?ν.
Χρ?ση του Unicode
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Λειτουργικ? συστ?ματα
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Παρ? τα τεχνικ? προβλ?ματα του? περιορισμο?? και την κριτικ? στη πορε?α, το Unicode ?χει επικρατ?σει ω? το κυρ?αρχο σχ?μα κωδικοπο?ηση? χαρακτ?ρων. Τα Windows NT και οι απ?γονο? του Windows 2000 και Windows XP κ?νουν εκτεταμ?νη χρ?ση του σχ?ματο? κωδικοπο?ηση? UTF-16 για εσωτερικ? αναπαρ?σταση κειμ?νου. UNIX λειτουργικ? συστ?ματα ?πω? GNU/Linux, Plan 9 απ? Bell Labs, BSD και Mac OS X ?χουν υιοθετ?σει το σχ?μα UTF-8, ω? τη β?ση για την αναπαρ?σταση πολυγλωσσικ? κε?μενο.
Ηλεκτρονικ? αλληλογραφ?α
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Το πρ?τυπο MIME ορ?ζει δ?ο διαφορετικο?? μηχανισμο?? για κωδικοπο?ηση ?χι-ASCII χαρακτ?ρων στα μην?ματα ηλεκτρονικ?? αλληλογραφ?α?,e-mails, αν?λογα με το αν οι χαρακτ?ρε? ε?ναι στι? επικεφαλ?δε? του ηλ.μην?ματο? ?πω? π.χ. η επικεφαλ?δα "Θ?μα:" ? βρ?σκονται στο κυρ?ο? κε?μενο του ηλεκτρονικο? μην?ματο?. Και στι? δυο περιπτ?σει?, προσδιορ?ζεται το αρχικ? σ?νολο χαρακτ?ρων καθ?? και η κωδικοπο?ηση μεταφορ??. Για ηλεκτρονικ? αλληλογραφ?α με Unicode χαρακτ?ρε? προτε?νονται το σχ?μα κωδικοπο?ηση? UTF-8 και η κωδικοπο?ηση μεταφορ?? Base64. Οι λεπτομ?ρειε? των δ?ο μηχανισμ?ν καθορ?ζονται στο πρ?τυπο MIME και γενικ? ε?ναι κρυμμ?νοι απ? τον απλ? χρ?στη λογισμικο? ηλ. αλληλογραφ?α?.
Η υιοθ?τηση του Unicode στην Ηλεκτρονικ? αλληλογραφ?α ε?ναι πολ? αργ?. Τα περισσ?τερα κε?μενα στην ανατολικ? Ασ?α κωδικοποιο?νται ?κομα σε τοπικ?? κωδικοποι?σει? ?πω? η Shift-JIS, και πολλ? δημοφιλ? προγρ?μματα ηλ.αλληλογραφ?α? ακ?μα και αν ?χουν κ?ποια unicode υποστ?ριξη εντο?τοι? δεν μπορο?ν να χειριστο?ν Unicode δεδομ?να σωστ?. Η κατ?σταση αυτ? δεν προβλ?πεται να αλλ?ξει το προσεχ?? μ?λλον.
Διαδ?κτυο
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Οι καινο?ργιοι πλοηγο? διαδικτ?ου μπορο?ν και απεικον?ζουν σωστ? ιστοσελ?δε? με Unicode χαρακτ?ρε? εφ?σον ?χει εγκατασταθε? η αν?λογη γραμματοσειρ?.
Παρ?λο που συντακτικο? καν?νε? μπορε? να επηρε?ζουν τη σειρ? με την οπο?α οι χαρακτ?ρε? επιτρ?πεται να εμφαν?ζονται και η γλ?σσα HTML 4.0 αλλ? και η XML 1.0 εξ ορισμο? υποστηρ?ζουν ?γγραφα που αποτελο?νται απ? χαρακτ?ρε? απ? ?λο το ε?ρο? των κωδικ?ν σημε?ων του Unicode εξαιρουμ?νων μ?νο κ?ποιων χαρακτ?ρων ελ?γχου τα μ?νιμα μη-διαθ?σιμα κωδικ? σημε?α D800-DFFF, οποιοδ?ποτε κωδικ? σημε?ο που τελει?νει σε FFFE or FFFF και οποιοδ?ποτε κωδικ? σημε?ο π?νω απ? 10FFFF. Αυτο? οι χαρακτ?ρε? παρουσι?ζονται ε?τε απευθε?α? ω? μπ?ιτ? σ?μφωνα με την κωδικοπο?ηση του εγγρ?φου,εφ?σον υποστηρ?ζονται απ? την κωδικοπο?ηση,? μπορο?ν να γραφτο?ν ω? αριθμητικ?? αναφορ?? χαρακτ?ρων βασισμ?νε? στο κωδικ? σημε?ο του Unicode χαρακτ?ρα, εφ?σον η κωδικοπο?ηση που χρησιμοποιε? το ?γγραφο επιτρ?πει τα ψηφ?α και τα σ?μβολα που χρει?ζονται για να γρ?ψουμε τι? αναφορ?? (κ?τι που συμβα?νει με ?λε? τι? κωδικοποι?σει? που ?χουν υιοθετηθε? στο διαδ?κτυο)
Για παρ?δειγμα οι αναφορ?? :
Δ
Й
?
?
?
あ
叶
葉
?
(? η ?δια τιμ? στο δεκαεξαδικ? με πρ?θεμα &#x
) εμφαν?ζεται στον πλοηγ? σου ω? Δ, Й, ?, ?, ?, あ, 叶, 葉 και ?—εφ?σον ?χει? την κατ?λληλη γραμματοσειρ?, αυτ? τα σ?μβολα φα?νονται σαν Greek capital letter "Delta", Cyrillic capital letter "Short I", Arabic letter "Meem", Hebrew letter "Qof", Thai numeral 7, Japanese Hiragana "A", simplified Chinese "Leaf", traditional Chinese "Leaf", and Korean Hangul syllable "Nyaelh", αντ?στοιχα.
Γραμματοσειρ??
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Ελε?θερε? και εμπορε?σιμε? γραμματοσειρ?? που βασ?ζονται στο Unicode πρ?τυπο ε?ναι κοιν??, με πρ?τε? τι? TrueType και τ?ρα τι? OpenType γραμματοσειρ?? που υποστηρ?ζουν και οι δ?ο Unicode απεικον?ζοντα? κωδικ? σημε?α σε συγκεκριμ?νε? εμφαν?σει? χαρακτ?ρων.
Υπ?ρχουν χιλ?αδε? γραμματοσειρ?? στην αγορ?,αλλ? λιγ?τερε? απ? δ?δεκα προσπαθο?ν να υποστηρ?ξουν την πλειοψηφ?α του συν?λου χαρακτ?ρων του προτ?που Unicode. Αντ?θετα οι βασισμ?νε? στο Unicode γραμματοσειρ?? συν?θω? υποστηρ?ζουν μ?νο βασικ? ASCII και κ?ποια συγκεκριμ?να αλφ?βητα. Αυτ? γ?νεται κυρ?ω? για λ?γου? οικονομ?α? των δημιουργ?ν γραμματοσειρ?ν και απ?δοση? των προγραμμ?των που μπορε? να γονατ?σουν καθ?? η απ?δοση γραμματοσειρ?ν ε?ναι μια διαδικασ?α που καταναλ?νει πολλο?? π?ρου? εν?? υπολογιστ?.
Χαρακτ?ρε? Unicode που δεν μπορο?ν να αποδωθο?ν γραφικ? απεικον?ζονται με ?να λευκ? τετρ?γωνο.
Μηχαν?? γραφικ?? απ?δοση? πολυγλωσσικο? κειμ?νου
[Επεξεργασ?α | επεξεργασ?α κ?δικα]- Uniscribe - Windows
- Apple Type Services for Unicode Imaging - ν?α μηχαν? για Macintosh
- WorldScript - παλ?α μηχαν? για Macintosh
- Pango - λογισμικ? ανοιχτο? κ?δικα
- ICU Layout Engine - λογισμικ? ανοιχτο? κ?δικα
- Graphite - (open source renderer from SIL)
Μ?θοδοι εισαγωγ??
[Επεξεργασ?α | επεξεργασ?α κ?δικα]Οι επεξεργαστ?? κειμ?νου Microsoft Word επιτρ?πουν την εισαγωγ? χαρακτ?ρων Unicode με δυο τρ?που?:
- πληκτρολογ?ντα? το δεκαεξαδικ? κωδικ? σημε?ο, π.χ. 014Β(? U+014b) για τον ?,και πατ?ντα?
alt + x
προκειμ?νου να αντικατασταθε? η συμβολοσειρ? στα αριστερ? του δρομ?α με τον αντ?στοιχο χαρακτ?ρα unicode. Συν?θω? γ?νεται και το αντ?στροφο,δηλαδ? ?ν ?χει? ?ναν unicode χαρακτ?ρα στα αριστερ? του δρομ?α και πατ?σει?Alt + x
το Word θα αντικαταστ?σει τον χαρακτ?ρα με το ισοδ?ναμ? του κωδικ? σημε?ο στο δεκαεξαδικ? ? ακ?μα - πληκτρολογ?ντα?
Alt + #
, ?που # ε?ναι το δεκαδικ? κωδικ? σημε?ο, π.χ.Alt + 0331
θα μα? δ?σει τον χαρακτ?ρα Unicode ?.
Το Gnome2 ακολουθε? το πρ?τυπο ISO 14755. Κρ?τησε πατημ?να τα πλ?κτρα Ctrl and Shift και εισ?γαγε στο δεκαεξαδικ? το κωδικ? σημε?ο του unicode χαρακτ?ρα που θ?λει? να εμφανιστε?.
Εξωτερικο? σ?νδεσμοι
[Επεξεργασ?α | επεξεργασ?α κ?δικα]- Συλλογ? ελληνικ?ν γραμματοσειρ?ν για X Window System που περιλαμβ?νει και unicode γραμματοσειρ??
- The Unicode Consortium
- Unicode versions: 3.1, 3.2, 4.0, 4.0.1, 4.1
- new characters, scripts and characters and scripts under investigation
- Code Charts (PDF)
- Table of Unicode characters from 1 to 65535 Αρχειοθετ?θηκε 2025-08-08 στο Wayback Machine.
- UTF-8, UTF-16, UTF-32 Code Charts and a character map (JavaScript)
- The Letter Database Uses forms to present groups in list or grid format by hexadecimal.
- Example text files using Unicode
- Unicode special character map is similar to the Windows version. Click a symbol to obtain either the named or numeric code for HTML.
- ConScript Unicode Registry a project to standardize part of the Private Use Area for use with artificial scripts and artificial languages. An explanation of how to propose character names in Unicode is available here.
- The secret life of Unicode Αρχειοθετ?θηκε 2025-08-08 στο Wayback Machine. "A peek at Unicode's soft underbelly" Describes problems requiring resolution. Includes links to Unicode resources.
- Tim Bray's Characters vs Bytes explains how the different encodings work.
- Alan Wood's Unicode Resources Contains lists of word processors with Unicode capability; fonts and characters are grouped by type; characters are presented in lists, not grids.
- The strongest denunciation of Unicode, and a response to it
- Software engineering:
- International Components for Unicode (ICU) Αρχειοθετ?θηκε 2025-08-08 στο Wayback Machine. An open source set of libraries that provide robust and full-featured Unicode services for your applications on a wide variety of platforms.
- The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) by Joel Spolsky of JoelonSoftware.com (this is now outdated, but still a reasonable starting point).
- Freedesktop.Org's Project UTF-8's purpose is to document and promote proper Unicode support in free and Open Source software.
- Supplementary Characters in the Java Platform from Sun Microsystems
- Seeing the entirety of Unicode printed out as a single large poster gives a good feel for the size of the code.