הבלוג של ארתיום
בלוג על לינוקס, תוכנה חופשית, מוזיקה, סלסה, ומה לא!
מאמרים בנושא תכנה חופשית.
מתיאוריה למציאות, או עד כמה UTF-16 באמת בעייתי
בהמשך לפוסט הקודם, החלטתי לעשות סקירה קצרה: "האם באמת תכנות שכתובות עם utf-16 לא עובדות כמו שצריך עם קידודים כפולים ומה קורה עם תכנות שמשתמשות בייצוג פנימי ב־utf-8/utf-32?"
לקחתי תו "𠂊" או U+2008A וניסיתי להציג אותו ביישומים שונים מבוססים על toolkitים שונים. התו הזה מתייחס ל־CJK Unified Ideographs Extension B ולא לא יכול להיות מיוצג ב־utf-16 בעזרת איבר אחד (שני בתים) אלא דורש צירוף של שני איברים (ארבעה בתים). אם אתם לא רואים את התו הזה, או רואים אותו כריבוע בדפדפן שלכם, אפשר להתקין גופן חופשי: AR PL ShanHeiSun Uni, בעלי דביאן יכולים להתקין חבילה ttf-arphic-uming. חייב לציין, אין מי מושג מה התו או המילה האלה אומרים, כך שמתנצל מראש.
קודם כל: היישומים שעובדים עם utf-16 שהתמודדו אתו בצורה יפה ונכונה (או פשוט לא מצאתי באגים ב־2 דקות ששיחקתי איתם) הם:
- OpenOffice שעובד עם icu (אם כי, אני לא בטוח שהוא משתמש בו בייצוג פנימי)
- Microsoft Word עבד ללא בעיות ועובד עם Windows API המבוסס על utf16.
- FreeMind שכתוב ב־Java הצליח להציג את התו ולערוך טקסט בצורה מסודרת. (Java משתמשת ב־utf-16 במחרוזות שלה).
אבל פה פחות או יותר נגמרו היישומים שעובדים עם utf-16 וגם מסתדרים עם התו הבעייתי. נתחיל:
המשך...UTF-8, UTF-16, Unicode וכל מה שביניהם.
היו היה בית, בתקופה של תחילת עידן המחשבים הוא היה מסוגל לשמור תו בודד. אבל אנושות הלכה והתפתח ויום אחד התברר שהוא לא מספיק. יש צרפתים, יש רוסים, יש סינים ולא ניתן לדחוף את הכל התווים הידועים לבית אחד מסכן. אז התאספו אנשים חכמים ובסוף שנות ה־80 --- תחילת 90 החליטו לבנות תקן אחיד שיכסה את כל השפות האפשריות --- Unicode.
האנשים האלה חשבו וחישבו ששני בתים יספיקו לכסות את כל השפות אפשריות. כך נולד קידוד של Unicode בשני בתים. בתחילת ה־90, יצרתי UNIX הגדולים גם חשבו ובנו UTF-8 שכדי להבטיח תאימות לאחור עם כל התכנה הקיימת --- כך נולד קידוד בעל אורך משתנה.
עבר הזמן, יצרני תכנה שונים הולכו בשני כיוונים: אחד להציג כל תו בשני בתים והשני להמשיך להשתמש ב־ANSI C String ולעבוד עם תווים בעלי ייצוג באורך שונה. אבל, באמצע שנות ה־90 כבר היה ברור ששני בתים לא יספיקו כדי לכסות את כל השפות האפשריות. ולכן התקן הורחב כך שהוא כלל ערכים מ־0 ועד ל־0x10FFFF.
המשך...מה השתנה בדפדפן הזה, או הניצוץ של כרום.
לא, אני לא הולך לכתוב עוד אחת מאלף ואחת סקירות מתלהבות (או לא כל־כך) על Google Chrome. בסה"כ הגיע עוד דפדפן מעשרות הקיימים: IE, Maxton, Firefox, Galeon, Epiphany, Konqueror, Safari, Flock, Camino, Opera ועוד. אז יש לנו עוד דפדפן, מה הסיפור שלו? היום, לבנות דפדפן זה משהו יחסית פשוט. קח מחלקה של KHTML, Gecko, או של WebKit, דחוף אותה למעטפת GUI ויש לך דפדפן. עכשיו נשאר להמציא עוד כמה עשרות כפתורים מוזרים, להוסיף כמה פיצ'רים נחמדים ולשווק.
לכן, כפי שאתם יכולים להבין אני לא הולך לדבר על דפדפן עצמו. הוא לא מעניין אותי בתור דפדפן יותר מאשר רוב הדפדפנים שפירטתי לעיל. מה שמעניין אותי באמת, זה הצירוף של WebKit עם המותג Google.
המשך...Debian Lenny ב־06/2009 - הייתכן?
באחד החיפושים ב־Google נתקלתי בפוסט הבא שמנחש בצורה די "מדעית" ש־Lenny ישוחרר בסביבות יוני 2009...
אני מתחיל לקרוע לעצמי שיער ולבכות... לא ייתכן, לא ייתכן, אבל ככל הנראה כן.
אם זה המצב, נראה לי שאתחיל לפזול לכיוון Ubuntu... או אולי הגיע זמן לבדוק Suse?
לינמגזין מת...
התחלתי להתעניין בקהילת הלינוקס בארץ בסביבות 2005. ווטסאפ ולינמגנזין היו שני המוקדים המרכזיים של קהילה. נהניתי לקרוא את שניהם. ווטסאפ תמיד היה הרבה יותר טכני ולינמגזין הכיל בלוגים רבים של הפעילים בתחום, לינמזין פרסם מאמרי־דעה וסקירות מעניינות כגון: OLPC, עסקת נובל־מיקרוסופט, סקירות בנושא GPLv3 ועוד.
אבל לאט־לאט המצב הלך והשתנה. עם פתיחת בלוגלי מרבית אנשים מרכזיים שכתבו בלינמגזין עברו אליו. בגלל סיבות כאלה ואחרות, סקירות מרכזיות נחלו כישלון: OLPC מת, OpenXML התקבל כתקן ISO מפוקפק ועוד.
עם הירידה כמות הידיעות המעניינות, הטון של לינמגזין הלך והחריף בשנים האחרונות שהתאפיין במספר דברים: שנאה כלפי מיקרוסופטלא שאני אוהב אותה וכל מה שנעשה על־ידה שגברה על העניינים הפרודוקטיביים של הקהילה, ביקורת (לא בונה) כלפי הקהילה הארץ.
מבחינתי היו שני אירועים שבסופו של דבר היו הקש שבר את גבו של הגמל.
- תגובה נזעמת בצורה קיצונית על פרסום ידיעה בווטסאפ המקבילה לידיעה בלינגזין שגמרה לי לחשוב על טיבו של העיתון האינטרנט הזה.
הכתבה מאת אורי שרף שהכילה את השורה הבאה:
אלא תזכורת ראויה בימים בהם "נציגי קהילת התוכנה החופשית" עסוקים ביחצון חברה אשר פועלת כדי לערער את יסודות הקהילה
ששמה במירכאות כמעט את כל הפעילים האמתיים בתחום התכנה החופשית בארץ.
לכן, מבחינתי לינגמזין מת. פעם אהבתי אותו, אבל היום הוא שם הפרדה בינו לבין כל שאר הפעילים בתחום תכנה חופשית. אני בחרתי בכל השאר.