מאמרים בנושא ‏תכנה ומחשבים‏.

לוותר על gc או לוותר על destructor?

ב־יום שלישי, 7 באוקטובר 2008, מאת ארתיום; פורסם תחת: פיתוח, תכנה ומחשבים, C++‎‏; ‏15 תגובות

היום, יש נטייה להשתמש בכל שפה אפשרית ב־GC -- כי היא פותרת המון בעיות בניהול זיכרון. כמעט כל השפות פופולריות (למעט C/C++/Pascal) מממשות אותה בצורה זו או אחרת.

כמעט כולם (למעט CPython,‏ Perl ו־vala) משתמשות בשיטה של "בדיקת נגישות" (Reachability). בשיטה זו מנוע GC פועל אחת לזמן מה, מחפש כל מופעי אובייקטים שאינם נגישים יותר ומוחק אותם.

השיטה הפחות נפוצה, שמתשמשים בה למשל ב־CPython, היא שימוש ב"ספירת הפניות" (Reference counting), אבל היא קשה למימוש ובעייתית באופן כללי, בגלל טיפול בלולאות סגורות, כאשר אובייקט יכול להפנות לעצמו, ובכך "מספר הפניות" לעולם לא ירד מתחת ל־0.

שימוש ב־GC שיטה הראשונה פותרת את בעיית ניהול הזיכרון, יחד עם זו היא מציבה בעיה הגדולה אחרת: destructors או finalizers --- מתודות שמבצעות "מחיקה" של האובייקט, הופכות לכמעט ולא רלוונטיות. כי אי אפשר לדעת מתי ישוחרר האובייקט. כלומר ב־Java, C#, IronPython, PHP, D וכמעט כל שפות אחרות שמשתמשות בשיטה הזו, destructors הם חסרי משמעות.

המשך...

על כלי פיתוח מהיר ועולם המחשוב

ב־יום שני, 6 באוקטובר 2008, מאת ארתיום; פורסם תחת: פיתוח, תכנה ומחשבים, C++‎‏; ‏8 תגובות

אחת הגישות המודרניות בפיתוח תכנה היא:

כוח אדם הוא יקר. החומרה היא זולה. לכן, נשתמש בכלי פיתוח יעילים, שיחסכו לנו את הצורך בכוח אדם יקר, במקום לפתח תכנה יעילה תוך חיסכון בחומרה פחות יקרה

החשיבה הזו הגיונית ומאוד נכונה בחלק משמעותי מהמקרים. לדוגמה, אם לקוח רוצה להקים אתר עבור העסק שלו, הדבר המשמעותי כאן זו השקעה בפיתוח, עיצוב, שיווק והטמעה. מחירים האלה הם הרבה יותר גדולים מאשר מחיר החומרה שתריץ את האתר הזה. יותר מזה, גמישות הקוד והפשטות שלו, שתאפשר בצע שינויים במידת הצורך היא מאוד קריטית. כי כולם יודע, שהלקוח אף פעם לא יודע מה הוא רוצה באמת.

כנ"ל, כאשר כותבים כלי בדיקה, יישומים פנימיים של ארגון --- זמן הפיתוח וגמישות הכלים הם קריטיים.

גם צורך בהעסקת כוח אדם מיומן היא משמעותית. כידוע, לא כל המתכנתים שווים. למשל, לפי נתוני indeed‏ ההבדל בין משכורת מפתח C++‎ לבין משכורת מפתח PHP או Asp.Net יכול להגיע עד פי־1.5--2.

השאלה היא, אם העיקרון הזה נכון והאם כדאי לצצד לו?

התשובה היא חד משמעית: לא. הוא נכון בחלק גדול מהמקרים, אבל הוא ממש לא נכון בהמון מקרים אחרים.

המשך...

תולדות הבלוג שלי (בעקבותיו של שלומי).

ב־יום ראשון, 5 באוקטובר 2008, מאת ארתיום; פורסם תחת: תכנה חופשית, אינטרנט, כתיבה, תכנה ומחשבים, WordPress בעברית, CppCMS; ‏0 תגובות

שלומי ישראל (הידוע כ־sijp) העביר לי משימה לכתוב בנושא "תולדות הבלוג שלי". בד"כ אני לא מתפתה להשתתף בשרשורי משימות כאלה, אבל הפעם, החלטתי שהנושא מספיק מעניין.

הכל התחיל לפני יותר משנתיים, כאשר פרסמתי את הכתבה הראשונה שלי. אז התקנתי מערכת בלוגים WordPress בעברית הסטנדרטית שהייתה אז עוד בגרסה 2.0.7. המערכת הייתה מאוד נחמדה והשתמשתי בה הרבה מאוד זמן.

התכנון המקורי היה להתרכז בשני נושאים:

  1. סלסה וריקוד ולהחליף פרסום כתבות באתר LaMusica.co.il‏‏ בכתיבה בבלוג שלי.
  2. להתחיל לכתוב בנושא תכנה חופשית

לצערי, הנושא הראשון, בסופו של דבר, הסתכם במספר מצומצם של כתבות, כך שהבלוג הפך לבלוג מחשבים כמעט טהור; ובסביבות אוקטובר 2007, הוא זכה להיכנס ל־planet.linux.org.il‏.

במקביל התחלתי לפתח טכנולוגיית web חדשה --- ‏CppCMS‏; ובדצמבר 2007, פתחתי בלוג נוסף באנגלית, שהיה אמור לשמש אותי לשתי מטרות:

  1. בניית פלטפורמת הניסוי של הטכנולוגיה החדשה
  2. פרסום מידע אודות CppCMS לקהל שלא מדבר בעברית.

יחד עם התקדמות הפרויקט, מערכת הבלוגים הפכה ליותר ויותר בשלה. במאי 2008 החלטתי להיפרד מוורדפרס ולהחליפו במערכת החדשה. מאד הבלוג הזה רץ על טהרת C++‎.

הפתעה לא נעימה מ־MySQL.

ב־יום שישי, 19 בספטמבר 2008, מאת ארתיום; פורסם תחת: תכנה חופשית, לינוקס, פיתוח, תכנה ומחשבים; ‏9 תגובות

אני יודע ש־MySQL זה לא בסיס נתונים מושלם, בעל מיליון ואחד פיצ'רים מעולים הדרושים לכל בסיס נתונים ארגוני. אבל יש לו יתרון אחר גדול... הוא מהיר מאוד, הרבה יותר מהיר מ־PostgreSQL ו־Sqlite3 (לפחות לפי הניסיון שלי).

בחיפוש של מקום פנוי בדיסק שלי גיליתי קובץ ibdata1 בגודל של 260MB. בהתחשב בעובדה, שכל בסיסי הנתונים שהגדרתי, הם כמעט ריקים, זה היה חשוד מאוד. אומנם, יצרתי מספר בסיסי נתונים גדולים בעבר, אבל לא ציפיתי שכל זה עדיין יישאר.

חופש על "mysql shrink database" הביא אותי להבנה: לא ניתן לעשות כיווץ לטבלאות InnoDB, אלא אם אתה מגדיר ב־my.cnf, שכל טבלה תנוהל בקובץ נפרד‏:

[mysqld]
innodb_file_per_table

אבל איך לכווץ בסיסי נתונים קיימים? לא ניתן! אפשר לשמור dump של אותו בסיס נתונים. לשנות הגדרות mysql, למחוק את הקובץ ibdata1 באופן ידני ולייבא את הנתונים מקובץ קיים מחדש.

לאחר מכן, פעולה כמו:

optimize table xyz;

פשוט תעבדו לך, מחיקת בסיס נתונים תגרום למחיקת המידע מדיסק ואפילו delete from xyz;‎ תגרום לריקון הקובץ! למזלי, לא היו לי בסיסי נתונים יקרים (הכל היה לצורך ניסויים), כך שיכולתי פשוט למחוק אותם ולוותר על תהליך dump. עם כל זה המצב היה מאוד מאכזב:

  1. מדוע הטבלאות לא מופרדות לקבצים שונים מלכתחילה?
  2. מדוע Debian לא דאגו לעשות את ההגדרות האלו כברירת מחדל?
  3. מי בכלל צריך לנהל מידע של כל בסיסי נתונים אפשריים בקובץ יחיד? לא צריך להסביר מדוע זה מסוכן.

מוסר השכל: אם אתה DBA של MySQL או סתם נפלה עליך משימה לנהל שרת MySQL, תמיד תגדיר עבודה עם קבצים מרובים, אחרת, יום אחד אתה תהיה בצרות. כמו מספר אנשים שנכלאו למצב בו, אין מספיק מקום פנוי בדיסק, כדי לעשות dump; וגם אין מספיק מקום בשרת בגלל הקבצים הענקיים שמסרבים לקטון.

כשנגמר המקום ב־"/"

ב־יום שישי, 19 בספטמבר 2008, מאת ארתיום; פורסם תחת: תכנה חופשית, לינוקס, תכנה ומחשבים; ‏6 תגובות

אתמול גיליתי שנגמר לי מקום בספריית "/" שאמורה להכיל כ־10G. כמובן ש־‎/home היא מחיצה נפרדת אבל עדיין... חסר לי מקום בצורה משמעותית.

כמובן, הדבר הראשון שמריצים במצב כזה apt-get clean שבד"כ משחרר אצלי כמה עשרות MB של מקום פנוי. אבל לאחר הפעולה הפשוטה הזו עדייו נשארו רק 150MB זמינים.

אחד הדברים האחרונים שהתקנתי לאחרונה היה tomcat5.5 לצורכי ניסוי. מחקתי אותו ואת כל התלויות שלו. עדיין המצב לא היה מזהיר במיוחד. הדבר הראשון שהחלטתי לבדוק זה איזה חבילות הן הגדולות ביותר. Google תוך חיפוש קצר הביא אותי לפקודה:

dpkg-query -W -f='${Installed-Size;10}\t${Package}\n' | sort -n

חשבתי, שהדברים הכבדים יהיו apache, mysql או כל מיני דברים מוסבכים אחרים שהתקנתי... אבל לא. זה היה הפלט (השורות האחרונות):

 69496      mingw32
 73428      valgrind
 76728      tetex-base
 82328      eclipse-platform-gcj
129740      openoffice.org-core
164304      openclipart-png
167892      ghc6
186672      openclipart-svg

חבילות כמו valgrind, tetex ו־OpenOffice ואפילו mingw32 משמשות אותי לעתים קרובות, כך שברור שהן יישארו.

openclipart די שימושי... אם כי במקרה הצורך אפשר לוותר עליו.

אבל: ghc6 -- ‏Haskell? התקנתי אותו פעם, קמפלתי איתו משהו וזה פחות או יותר כל השימוש שהיה לי בו. eclipse? מעולם לא חשבתי שהוא מפלצת עד כדי כך! פעם התקנתי אותו, ניסיתי לעבוד איתו אבל די וויתרתי עליו כי הוא היה נורא כבד. והדבר הזה (+תלויות) תופס כל־כך הרבה מקום! אחרי שמחתי את שני הכלים האלה ואת התלויות שלהם, קיבלתי בחזרה כ־600MB...

למרות שאני עובד עם לינוקס המון זמן, אלה היו הפתעות גדולות, במיוחד Haskell שאני לא כתבתי בו אפילו שורת קוד אחת. מוסר השכל: "הכר את הכלים שלך. הם יעזרו לך בעת צורה (ולא רק)"

העמוד הבא

העמוד הבא

דפים

נושאים