הבלוג של ארתיום :: תכנה חופשית http://artyom.cppcms.com/ בלוג על לינוקס, תוכנה חופשית, מוזיקה, סלסה, ומה לא! שילוב בין טכנולוגיות Web שונות ו-CppCMS http://artyom.cppcms.com/post/317 http://artyom.cppcms.com/post/317 <div style="direction:rtl"> <p>כשיש לך מערכת ווב גדולה ומפותחת ואתה צריך להעביר חלקים קריטיים ממנה לטכנולוגיה מהירה יותר (קרי CppCMS) אתה נתקל קודם כל בבעיה הבסיסית - איך לשתף מידע.</p> <p>נתונים גולמיים זה קל - יש מסדי נתונים, יש קבצים - אין פה משהו מסובך, אבל אתה צריך גם לשתף מידע על המשתמש ועל ה-session שלו בין הטכנולוגיות ופה כל אחד ממש את מה שהוא צריך בצורה אחרת. מצד שני זה מאוד חיוני לשתף מידע קריטי כמו זיהוי משתמש בצורה מאובטחת.</p> <p>לכן, יצרתי שכבת תיאמות שמאפשרת לגשת ל-Session של CppCMS מכל שפת תכנות אחרת.</p> <p>בשלב ראשון עדכנתי את המחלקות הקשירות לניהול ה-Session של CppCMS שיוכלו לפעול בצורה בלתי תלויה מהמערכת. <a href="http://sourceforge.net/p/cppcms/code/HEAD/tree/framework/trunk/cppcms/capi/session.h">יצרתי API נקי</a> מבוסס C בלבד כדי שלא יהיו בעיות כמו חריגות (exceptions) האופייניות ל-++C וגם כדי שאפשר היה לטעון את הפונקיות ישירות בעזרת dlopen.</p> <p>אחר כך יצרתי מספר מודולים עבור שפות שונות:</p> <ul> <li>PHP עם שימוש ב-Swig</li> <li>Java/Servlet עם שימוש ב-JNA</li> <li>Python עם שימוש ב-ctypes והתממשקות עם Django (אבל לא מוגבל ל-Django)</li> <li>Asp.Net עם שימוש ב-PInvoke</li> </ul> <p>כמובן זה לא מוגבל אליהם בלבד. אבל לכל שפה חדשה צריך לבנות מעטפת. שקלתי לעשות גם ל-Ruby on Rails אבל ויתרתי לבינתיים כי אין לי ניסיון עם Ruby בכלל, אז שמישהו יתרום בעת הצורך.</p> <p>חייב להגיד לכל טכנולויה היו בעיות משלה... למשל ב-Python היו התנהגויות מוזרות כשניסיתי לבנות מתודות באופן דינאמי, ב-Java/JNA הכל עבר חלק להבפליא. PInvoke שיגע אותי עם חוסר רצון שלו להמיר UTF-8 ל-string ובחזרה (אגב Mono כן עושה זאת בצורה שקופה אבל לא Net. של Windows מתעקש להשתמש בקידוד ANSI). יצירת מודולים עם Swig עבדה לא רע בכלל, אבל נדרשת עוד מעטפת כדי להתאים את הכל בסופו של דבר לשפה עצמה והתנהגותה.</p> <p>ואיך זה נראה</p> <p>PHP:</p> <pre><code>// pool initialization $pool=CppCMS_SessionPool::from_config('cppcms-config.js'); // per request session access $session=$pool-&gt;session(); $session-&gt;load(); $x=0; if($session-&gt;is_set('x')) { $x=$session['x']; } $x=intval($x)+1; $session['x']=$x; $session-&gt;save(); ... </code></pre> <p>Java/Servlet:</p> <pre><code>static SessionPool pool; public void init() throws ServletException { pool = SessionPool.openFromConfig("/path/to/cppcms-config.js"); } public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { Session session = pool.getSession(); session.load(request); String x="0"; if(session.isSet("x")) x=session.get("x"); x=Integer.toString(Integer.parseInt(x)+1); session.set("x",x); session.save(response); session.close(); ... } </code></pre> <p>Python/Django:</p> <pre><code># Create global pool pool=cppcms.SessionPool('/path/to/cppcms-config.js') # Actual view def home(request): s=pool.session() s.load(django_request=request) v='0' if 'x' in s: v= s['x'] s['x']=str(int(v)+1) response = HttpResponse() s.save(django_response=response) ... </code></pre> <p>C#/ASP.Net:</p> <pre><code>static SessionPool pool; static Example() { pool = SessionPool.FromConfig("cppcms-config.js"); } protected void Page_Load(object sender,EventArgs e) { using(Session s = pool.Session()) { s.Load(Request); string v="0"; if(s.IsSet("x")) v=s["x"]; v = (int.Parse(v) + 1).ToString(); s["x"]=v; s.Save(Response); } ... } </code></pre> <p>אפשר לראות את הקוד והדוגמאות המלאות <a href="http://sourceforge.net/p/cppcms/code/HEAD/tree/framework/trunk/contrib/integration/session/">כאן</a></p> <p>אני עדיין תוהה עם איזו עוד פלטפורמה כדי לעשות אינטגרציה. בסופו של דבר חשובה לי הפשוטות והנוחות של העבודה.</p> </div> לשרת את כל אתרי החדשות בארץ בעזרת... CppCMS http://artyom.cppcms.com/post/315 http://artyom.cppcms.com/post/315 <div style="direction:rtl"> <p>אני לא יודע אם שמתם לב, אבל בשנה האחרונה קצב הפיתוח של תשתית CppCMS ירד בצורה ניכרת. ריכזתי את מרבית המאמצים במערכת פרסום מיוחדת הבנויה על תשתית ה־CppCMS שפותח עבור לקוח.</p> <p>הפרויקט נקרא <a href="http://linicom.co.il">ליניקום</a>.</p> <p>היום, כשליניקום כבר פעיל זמן רב ומתוחזק ע"י צוות מורחב, אני אוכל להקדיש יותר זמן לתשתית CppCMS עצמה.</p> <p>מספר מילים על "ליניקום":</p> <p>"ליניקום" הוא מנוע שמביא פרסומות תלויות תוכן ומותאמות למשתמש לאתרים שונים בקלות רבה. מרבית אתרי החדשות הגדולים בארץ משתמשים בשירותי ליניקום, ביניהם: ynet, הארץ, מאקו, Jerusalem Post, ואללה ועוד רבים אחרים כולל מספר אתרים גדולים בחו"ל.</p> <p>להלן כמה עובדות מעניינות:</p> <ul> <li>ליניקום מבוססת על טכנולוגית CppCMS</li> <li>המערכת משרתת כ־10,000,000 פניות המותאמות למשתמש ביום - קרי כ־115 פניות בשניה.</li> <li>בשעות העמוסות הקצב מגיע לכ־160 פניות בשניה.</li> <li>השרת מייצר תעבורה יוצאת ממוצעת של כ־11 מגאביט בשניה.</li> <li>צריכת זיכרון הכוללת של המערכת (שרת וואב, בסיס נתונים, יישום, מערכת ההפעלה) הוא בסביבות 360MB</li> <li>העומס הממוצע על המעבדים הוא כ-5%</li> <li>השרת רץ על c1.medium instance בודד ב־Amazon EC2</li> </ul> <p>המערכת רצה מאחורי lighttpd ומשתמשת ב־PosgreSQL לשמירה וניהול הנתונים בצורה אינטנסיבית, עם זאת, מרבית הנתונים הנדרשים בזמן אמת שמורים ומנוהלים בזיכרון.</p> <p>כמעט כל פניה לשרת דורשת עיבוד נתונים על מנת לספק פרסומות מותאמות אישית, מבחינה טכנית, זה אומר שלא ניתן לעשות "מיקור חוץ" של הפניות האלה לקבצים הסטטיים וכל פניה של כל לקוח צריכה להיות מטופלת בנפרד.</p> <p>מערכת הפרסום הזו, היא הדוגמה הקלאסית לשימוש בטכנולוגיית CppCMS - מערכת שצריכה להיות מהירה ואפקטיבית. מערכת שמסוגל להתמודד עם עומסים גבוהים ולעתים חריגים ללא בעיות ולספק איכות השירות גבוהה ביותר.</p> <p>שימוש בנתונים השמורים בזיכרון, ניהול נתונים שלא יכולים להיות שמורים בזיכרון מטמון - זה המקום בו יכולות CppCMS באות לידי ביטוי במלואן. יכולת גדילה גבוהה עם דרישות תחזוקה מינימליות, אמינות גבוהה - האם אלה שמאפשרים לדאוג לצד העסקי בלי לחשוב על בעיות ביצועים אפשריות.</p> </div> שעון קיץ בישראל ומחשבים http://artyom.cppcms.com/post/316 http://artyom.cppcms.com/post/316 <div style="direction:rtl"> <p>ביום ראשון האחרון, חצי מדינת ישראל התעוררה עם שעונים לא נכונים.</p> <p>כולנו מוכנים לכוון את השעונים שלנו כשיש מעבר לשעון חורף, בודקים פעמיים יומנים וזמנים, מסתכלים על שעונים וכד'. אבל מה עושים שימים בהם לא התשנה שעון - אלא היה אמור להשתנות השעון - אף אחד לא שם לב.</p> <p>בזיון. מרבית הפצות לינוקס לא הספיקו לעדכן את tzdata, למשל לא Debian ולא Ubuntu יציבות קיבלו איזורי זמן נכונים (גם בעדכונים אחרונים), העדכון האחרון של Red Hat גם הוא יצא ממש לא מזמן. כמובן גם Windows לא הספיקו להוציא עדכונים - כך שגם אשתי שלא משתמשת בלינוקס התעוררה עם שעון לא תקין במחשב שלה - והוא תמיד מעודכן אצלה עד לדקה האחרונה.</p> <p>אני כמובן כבר לא מדבר על יישומים שמנהלים את <a href="http://en.wikipedia.org/wiki/Tz_database">IANA Time Zone Database</a> בעצמם, יישומים <em>זניחים</em> כמו Java או ICU וכד.</p> <p>אז מה לדבר על טלפונים סלולריים? <a href="http://idkn.wordpress.com/2013/09/05/daylight-saving-and-cellular-companies/">יש כאלה האשימו בבזיון את חברות הסלולר</a>... אבל נדמה לי שבעיה קצת יותר עמוקה.</p> <p>עדכון החוק האחרון היה ב<a href="http://he.wikipedia.org/wiki/%D7%A9%D7%A2%D7%95%D7%9F_%D7%94%D7%A7%D7%99%D7%A5_%D7%91%D7%99%D7%A9%D7%A8%D7%90%D7%9C#.D7.94.D7.97.D7.95.D7.A7_.D7.94.D7.A0.D7.95.D7.9B.D7.97.D7.99_-_.D7.94.D7.97.D7.9C_.D7.9E.D7.A9.D7.A0.D7.AA_2013">יולי 2013</a> - אז האם אפשר להאשים את מאות (אם לא אלפי) האנשים והארגונים האחראים על עדכונים שוטפים שלא הספיקו להפיץ את עדכוני איזור הזמן האחרונים? האם אפשר להאשים מיליוני משתמשים בישראל בכך שלא התקינו את העדכונים האחרונים (אם הם היו בכלל)?</p> <p>התשובה היא: הבזיון האמתי הוא לא אותם האנשים אלא החקיקה חפוזה שלא באמת מתחשבת בהשלכות. כנראה לא היה מי שהסביר לח"כ היקרים שלנו ששינוי איזור זמן זה לא בדיוק הזזת מחוגים בשעה המתאימה. (או הסבירו אבל אף אחד לא הקשיב או העדיף שינוי פופליסטי)</p> </div> שוחררה גרסה 1.0.3 של CppCMS הכוללת תיקון של פריצת אבטחה http://artyom.cppcms.com/post/313 http://artyom.cppcms.com/post/313 <div style="direction:rtl"> <p>היום שוחררה גרסה 1.0.3 של CppCMS שמתקנת פריצת אבטחה במנגנון בדיקת תקינות קלט UTF-8, שאפשר למערכת לקלוט מחרוזות לא תקינות. באג כזה יכול בתיאוריה להביא לפריצת XSS.</p> <p>מומלץ לשדרג CppCMS לגרסה האחרונה.</p> <p>המקור של הבאג נמצא ב־Boost.Locale. הבאג תוקן בגרסה 1.53 שעומדת להשתחרר בקרוב. מי שמשתמש בפונקציות של Boost.Locale לבדיקת תקינות הקלט UTF-8 צריך לקחת את אפשרות פריצת האבטחה הזו בחשבון.</p> <p>מי שלא יכול לשדרג את גרסת ה־Boost יכול להשתמש בטלאי הבא:</p> <p><a href="http://cppcms.com/files/locale/boost_locale_utf.patch">http://cppcms.com/files/locale/boost_locale_utf.patch</a></p> </div> הרהורים על Java... או זה לא מגניב, אבל זה עובד http://artyom.cppcms.com/post/312 http://artyom.cppcms.com/post/312 <div style="direction:rtl"> <p>לאחרונה יצא לכתוב מעט ב־Java, אחד מהם היה תוסף ל־<a href="http://en.wikipedia.org/wiki/ImageJ">ImageJ‏</a> כחלק מהעבדת התזה שלי, במקרה השני כתבתי יישום GUI קטן שהייתי צריך אפשרות להריץ אותו במספר פלטפורמות בצורה פשוטה.</p> <p>התחושה העיקרית שקיבלתי מהשפה:</p> <blockquote><p>בעוד 50 שנה ימשיכו לתחזק ולכתוב קוד שכתוב בה</p></blockquote> <p>אולי למשפט הזה יש קונוטציה שלילית, אבל למעשה אני מתכוון לזה במובן הטוב ביותר, זאת השפה, סליחה אני אתקן, זאת פלטפורמה, שבנויה לשרוד שנים. זאת לא טכנולוגיה מגניבה שקמה שלשום, התפתחה לכיוונים שונים ומשונים, אלא סביבה מסודרת, מתוכננת היטב וגם היא מכילה "אי־נוחויות" הן לא מספיק קריטיות. עכשיו אני אפרט.</p> <p><strong>הסדר</strong> פשוט מובנה בשפה בצורה שלפעמים "מציקה" אבל מצד שני מאוד מקלה עליך. החל משמות הקבצים ומחלקות, צורה של הגדרת מתודות, התיעוד (JavaDoc) הסטנדרטי, הספציפיקציות המדויקות (ללא Undefined Behaviour). בקוד Java <em>קל</em> התמצא, קל לקרוא, קל לכתוב.</p> <p>ניהול החריגות שחלק מהאנשים לא אוהבים ב־Java פשוט עושה סדר. אם צריך לטפל במשהו אתה לא תשכח. הן חלק מהחוזה שלך עם המתודה. לפעמים זה מציק (מה לעזאזל אתה צריך להתייחס ל־IOException כשאני יודע שיש קובץ וזה לא מעניין אותי כרגע), אבל בפועל זה גורם לך לכתוב בצורה הרבה יותר מסודרת.</p> <p><strong>פשוטות:</strong> אין בה תכונות מגניבות, אתה לא יכול לכתוב בשורה אחת חישוב מסובך כמו ב־Matlab, אתה לא תוכל לכתוב בשלוש שורות פונקציה מגניבה שתעשה משהו יפה, מצד שני, אתה יודע בדיוק מה קורה, ההתנהגות היא ברורה וקל להבין מה קורה.</p> <p><strong>עושר ה־API:‏</strong> אני חשוב שזה אחד הצדים חזקים ביותר של השפה: GUI,‏ Unicode, ‏ Web, מתמטיקה, רשת, I/O ועוד אלף ואחד דברים וכל זה מובנה, עובד, ותואם לאחור. אתה יכול כתוב יישומים ענקיים בלי להזדקק לספריית צד ג'. אתה רוצה לשלוח חללית למאדים: תייבא org.marse ו־org.nasa.spaceship ותקרא למתודה "lunch".</p> <p><strong>הפצת תכנה:</strong> הקלות בה יכולתי לכתוב תוסף ל־ImageJ ולחבר אותו הייתה פשוט מעולה - אתה מוריד Class וזה "פשוט עובד". נכון, אם לוקחים תכנות כמו GIMP גם להם קל לכתוב תוסף ב־Python, אבל אתה לא תוכל תכתוב שום דבר רציני שדורש חישוב אמתי בו, לעומת זאת ב־Java המהירות קרובה הרבה יותר למהירות קוד ה־C או C++‎.</p> <p>בדיוק בעזרת שפה (סליחה פלטפורמה) עם התכונות האלה אתה בונה מערכות שתשרודנה שנים על גבי שנים ותוכל תחזק אותם בקלות לאורך הזמן. בקיצור, זאת פלטפורמה מאוד לא מגניבה, אבל, אולי דווקא בגלל זה, היא תשרוד עוד שנים רבות.</p> <hr /> <p>שורה תחתונה, אני מאוד נהניתי לעבוד ב־Java.</p> </div> Comet בצורה שפויה http://artyom.cppcms.com/post/311 http://artyom.cppcms.com/post/311 <div style="direction:rtl"> <h3>‏ HTML5 ו־Comet</h3> <p>היום HTML5 מציע שני כלים עיקריים ליישומי <a href="http://en.wikipedia.org/wiki/Comet_%28programming%29">‏Comet‏</a>:</p> <ul> <li>טכנולוגיית <a href="http://en.wikipedia.org/wiki/WebSocket">WebSockets‏</a></li> <li>טכנולוגיית <a href="http://dev.w3.org/html5/eventsource/">Server-Sent Events‏</a></li> </ul> <p>מבחינה טכנית, WebSockets ‏(WS) מייצרים קשר דו־כיווני מלא ומאפשרים הן לשרת והן לקוח לשלוח הודעות בזמן אמת - בלי לפתוח קשרים נוספים. לעומת זאת Server-Sent Events‏ (SSE) זהו קשר חד־כיווני, בו השרת הוא זה ששולח אירועים ללקוח ואם הלקוח צריך לשלוח משהו לשרת, הוא משתשמש בכלי Ajax נוכחיים כמו XMLHttpRequest‏ (XHR).</p> <p>למען האמת, עד עכשיו יצא לי לעקוב אחרי התפתחות של WS. הפרוטוקול החליף מספר גרסאות, הדפדפנים שינו את המימושים בהתאם עד שהפרוטוקול התייצב. כיום התמיכה ב־WS קיימת ברוב הדפדפנים עדכניים ואמורה להיכנס גם ל־IE10. לעומת זאת, כל הנושא של SSE חלף על פניי ולא שמתי עליו לב.</p> <p>כיוון שאני מעסק בצד השרת בעיקר, הכנסתי את נושא ה־WS <a href="http://cppcms.com/wikipp/en/page/cppcms_1x_tasks#Provide.WebSockets.support">לתכנית העבודה שלי</a>. אבל עדיין לא הצלחתי להגיע אליו; ולא במקרה.</p> <p>למרות העתיד ה"זוהר" של WS, המימוש הוא לא פשוט. לא מדובר כאן בבעיה טכנית, הרי תמיכה ב־Comet כבר <a href="http://cppcms.com/wikipp/en/page/cppcms_1x#Comet.Programming">קיימת ועובדת יפה</a>, הבעיה היא בעיה מהותית: <strong>כדי לממש WS צריך לשנות פרוטוקול HTTP.</strong> ברגע ש"לחיצה היד" של WS נגמרת, לא מדובר עוד ב־HTTP, אלא בפרוטוקול שונה לחלוטין.</p> <p>לכן, הכלים ופרוטוקולים שבעזרתם יישומים מתקשרים עם שרתי Web, לא מתאימים. למשל, אי אפשר להעביר תקשורת של WS מעל FastCGI, SCGI או CGI. גם אם היישום שלך עובד ב־HTTP, לא כל שרת web ידע להתמודד עם הבעיה: החלפת ה־HTTP בפרוטוקול חלופי.</p> <p>לכן, אפילו ש־WS, זאת טכנולוגיה מבטיחה, היא עדיין רחוקה מהבשלות האמתית.</p> <p>לעומת זאת, SSE, שנדחקו הצדה, לא סובלים מהבעיות האלה!</p> <ul> <li>SSE לא משנים את פרוטוקול ה־HTTP, לכן, אין בעיות שימוש בתשתיות הקיימות.</li> <li>הביצועים של SSE לא נופלים על אלה של WS.</li> <li><p>SSE הרבה יותר קלים לתפעול:</p> <ul> <li>מכילים מנגנון סנכרון אוטומטי, במקרה של התנתקות</li> <li>מאפשרים לשלוח אירועים שונים ברמת JavaScript בלי שכבות נוספות</li> <li>ניתן לסגת <strong>בקלות</strong> ל־Long Polling עם XHR פשוט במקרה שהדפדפן לא תומך ב־SSE.</li> </ul> </li> </ul> <p>החיסרון היחידי של SSE לעומת WS: לא ניתן לשלוח הודעות באותו הקשר לשרת. אלא לכל הודעה לשרת צריך לשלוח XHR משלו. אבל? SSE מכסה את הרוב המקרים של שימוש ב־Comet!</p> <p>המימוש? קיים ב־Firefox,‏ Opera‏, Chrome‏, Safari ואמור להיכנס ל־IE10</p> <h3>אז איך זה עובד</h3> <p>בואו נדגים אפליקציה שמציגה את מחיר המניה העדכני ביותר בדפדפן:</p> <p>בצד הלקוח, אנחנו נכתוב את הקוד הפשוט הבא:</p> <pre><code>function read_data() { var stream = new EventSource('/ticker/get'); stream.onmessage = function(e){ document.getElementById('price').innerHTML=e.data; }; stream.onerror = function(e){ console.log(e); }; } read_data(); </code></pre> <p>אנחנו פותחים EventSource ועל כל אירוע שמכיל מידע אנחנו מעדכנים שדה html עם המחיר העדכני ביותר.</p> <p>בצד השרת הנושא שקצת יותר מורכב כי אנחנו צריכים לנהל מספר קשרים:</p> <p>כשנכנס קשר חדש, אנחנו מכינים אותו - מגדירים את ה-Content-Type כ־<code>text/event-stream</code>, מבטלים caching בדרך.</p> <p>לוקחים את ה־id של הערך הידוע האחרון, זה יאפשר לנו לדעת אם הלקוח התנתק אז אם הוא יודע את המחיר העדכני ביותר או לא. אם הערך שונה מהערך הנוכחי, אנחנו שולחים עדכון, אחרת מכניסית אותו ל"רשימת המתנה" - כל הלקוחות הממתינים לעדכון.</p> <pre><code>void main(std::string /*url*/) { response().set_content_header("text/event-stream"); response().set_header("Cache-Control", "no-cache"); auto last_id = atoi(request().cgetenv("HTTP_LAST_EVENT_ID")); auto context=release_context(); if(last_id != counter_) { async_send(context); } else waiters_.insert(context); } </code></pre> <p>כיצד אנחנו שולחים עדכונים:</p> <p>התוכן מורכב מה־id - של המחיר - מנגנון הסנכרון שלנו והתוכן - המחיר עצמו.</p> <pre><code>void async_send(booster::shared_ptr&lt;cppcms::http::context&gt; waiter) { waiter-&gt;response().out() &lt;&lt; "id:" &lt;&lt; counter_ &lt;&lt;"\n" "data:" &lt;&lt; price_ &lt;&lt; "\n" "\n"; </code></pre> <p>אחר כך אנחנו מגדירים completion-handler שיבדוק אם פעולה הצליח (אם לא אז קשר נסגר אין מה לעשות) ואם כן, ואין עדכונים נוספים ומכניסים אותו לרשימת ההמתנה.</p> <pre><code> waiter-&gt;async_flush_output([=,counter_](cppcms::http::context::completion_type status){ if(status!=0) return; if(counter_ != this-&gt;counter_) { this-&gt;async_send(waiter); } else { this-&gt;waiters_.insert(waiter); } }); } </code></pre> <p>עכשיו נכתוב פונקציה קטנה שמאפשרת לנו לעדכן את אלו שממתינים למחיר חדש:</p> <pre><code>void update_price(double new_one) { counter_++; price_ = new_one; for(auto waiter : waiters_) { async_send(waiter); } waiters_.clear(); } </code></pre> <p>נעדכן מונה כדי לסמן מחיר חדש, נעבור על הרשימה ונשלח מחיר מעודכן לכולם. מנגנון פשוט שניתן לממש עם כלים פשוטים (במידה והתשתית שלך תומכת ב־Comet).</p> <p>ניתן למצוא <a href="http://cppcms.com/files/ticker/">כאן</a> את הקוד המלא.</p> <h3>חיבור לשרת</h3> <p>כדי שהמנגנון הזה יעבוד צריך לוודא ששרת ה־Web ישלח את התוכן באופן מידי ולא ישמור אותו בזיכרון (בציפייה שעוד מידע יגיע).</p> <ul> <li>Lighttpd עושה את זה בלי בעיה ב־FastCGI,‏ SCGI ו־HTTP כברירת מחדל.</li> <li>Apache עושה את זה כברירת מחדל ב־SCGI ו־HTTP אבל ב־FastCGI דרושה אופציה ‎-flush ואז הכל תקין.</li> </ul> <p>לעומת זאת, "Nginx המהולל" עושה בעיות. בפרוטוקולים SCGI ו־HTTP ניתן לבטל buffering עם אופציה <code>http_buffering off</code> או <code>scgi_buffering off</code> אבל ב־FastCGI, שהוא הפרוטוקול הכי נפוץ בעבודה עם שרת Web <a href="http://trac.nginx.org/nginx/ticket/159">אופציה כזו לא קיימת!</a> כרגיל, Nginx מפתיע... (או שלא).</p> <p>אז כרגיל, עוד סיבה טובה <strong>לא להשתמש ב־Nginx</strong>. אז אני אחזור את הטענה שלי: <a href="http://artyom.cppcms.com/post/303">Nginx, תודה לא, Lighttpd‏</a>.</p> </div> מצגת מאוגוסט פינגווין 2012 http://artyom.cppcms.com/post/310 http://artyom.cppcms.com/post/310 <div style="direction:rtl"> <p>המצגת של ההרצאה שלי באוגוסט פינגווין 2012 על CppCMS נמצאת <a href="http://cppcms.com/files/ap2012/">כאן</a></p> <p>גרסת ‏<a href="http://cppcms.com/files/ap2012/ap-cppcms-for-dw.odp">ODF‏</a>, גרסת <a href="http://cppcms.com/files/ap2012/ap-cppcms-for-dw.pdf">‏PDF‏</a></p> <p>רישיון: ייחוס-שיתוף זהה 1.0 ישראל של Creative Commons‏</p> </div> כשעפים על מספר מעבדים http://artyom.cppcms.com/post/309 http://artyom.cppcms.com/post/309 <div style="direction:rtl"> <p>לפני כמה ימים <a href="http://thread.gmane.org/gmane.comp.lib.cppcms.user/1633">קיבלתי דיווח</a>, שתוכנה פשוטה שעובדת עם CppCMS עפה ב־FreeBSD כשיוצרים עומס. קיבלתי trace של המחסנית, שהיה נראה חשוד ומוזר. ניסיתי לשחזר... הכל היה תקין.</p> <p>אז הופנית ל<a href="http://sourceforge.net/tracker/?func=detail&amp;aid=3535893&amp;group_id=209965&amp;atid=1011835">דיווח על באג ישן</a> וסגור שנראה כשתי טיפות מים דומה לתעופה הזו. אז הבנתי שבכל זאת מדובר במשהו אמתי. פתחתי VirtualBox, הורדתי image של FreeBSD 9.0/64bit ותוך עשר דקות התחלתי לנסות שוב. ללא הועיל. ואז קיבלתי תוכנה שלדוגמה (טריביאלית לחלוטין) שבאמת עפה!</p> <p>מעמיסים עליה כמה אלפי פניות ומידי פעם אני מקבל תעופה בפניה לאובייקט <code>std::locale</code> - האובייקט שמחזיק מידע על לוקל המערכת ובפרט הקידוד שלה (כדי להוסיף ל־content-type).</p> <p>צללתי פנימה והתחלתי לחפור - זה היה נראה כמו באג שקשור ל־threading, ניסיתי גרסאות קומפיילר שונות ואופציות שונות - תעופה היה קבועה וברורה.</p> <p>עכשיו קצת רקע: אובייקט הלוקל הוא אובייקט מאוד יעיל שמנהל הכל עם reference-counting - כך שבפועל קיים אובייקט יחיד ששומר את המידע - אז התחלתי לעקוב אחריו וגיליתי שאם יוצרים עומס על המערכת, האובייקט לא נמחק - או נמחק מוקדם מידי ומיד אחריו באה התעופה.</p> <p>פה נדלקה לי מנורה אדומה - משהו לא בסדר ב־reference-counting, קרי הוא לא מתבצע בצורה אטומית. הכנתי תוכנית לבדיקה שהעתיקה את האובייקט מיליוני פעמים ממספר חוטים - הכל תקין.</p> <p>נכנסתי עוד יותר פנימה והתחלתי להדפיס את המונה (שהוצאתי בדרך לא דרך כי הוא private) ואכן - הוא ממש לא יציב, הולך וגדל עם הזמן - קרי, קיבלתי אמות - יש בעיה במונה!</p> <p>המשכתי לחפור עוד יותר לעומק והגעתי לקוד שמבצע את עדכון המונה ב־‎<code>libstdc++</code>‎:</p> <pre><code>if (__gthread_active_p()) __atomic_add(__mem, __val); else __atomic_add_single(__mem, __val); </code></pre> <p>כאשר המטרה של הקוד היא - אם אנחנו רצים מחוט אחד - אז אפשר לבצע חיבור פשוט וזול, אחרת מנהלים עדכון מונה בצורה אטומית - נכנסתי עם gdb בקוד לדוגמה וגיליתי:</p> <ul> <li>אם אני לא עושה קישור עם libpthread - הוא תמיד מריץ קוד עבור מערכת עם חוט יחיד.</li> <li>אחרת תמיד מבצע פעולה אטומית.</li> </ul> <p>מה הבעיה? הספרייה שלי קשורה ישירות ב־libpthread, אבל התכנה הראשית לא! בלינוקס זה לא מפריע אבל ב־FreeBSD זה לא עובד!</p> <p>אז הוספתי דגלון ‎<code>-lpthread</code>‎ לתכנה הראשית והבעיה נפתרה ב־100% - המונה הפך ליציב ומתאפס מתי שצריך.</p> <p>כנראה צריך ללכת לחברה ב־FreeBSD או ב־GCC ולפתוח באג: אם התכנה הראשית לא צריכה להפעיל חוטים באופן ישיר זה לא אומר שהספריות לא עובדות עם החוטים!</p> <p>זה גם הסביר לי מדוע אותו באג שנסגר בגלל שלא היה ניתן לשחזר אותו, לא השתחזר - כי הבעיה נפתרה כנראה במקרה ע"י קישור ל־libpthread.</p> <p>כך או אחרת, שמחתי שמצאתי את הבעיה, אפילו שהוא ממש לא הבעיה של ה־framework.</p> </div> כיצד לא לעשות יוניקוד http://artyom.cppcms.com/post/308 http://artyom.cppcms.com/post/308 <div style="direction:rtl"> <p>הסיפורו של הניסיון להדפיס "שלום" במספר שפות במסוף של חלונות.</p> <p><a href="http://blog.cppcms.com/post/105">http://blog.cppcms.com/post/105</a></p> </div> לבנות RPM להרבה הפצות http://artyom.cppcms.com/post/306 http://artyom.cppcms.com/post/306 <div style="direction:rtl"> <p>כשאתה מפתח הפרויקט קוד־פתוח, קל מאוד להפיץ קוד מקור, אבל כשזה מגיע לקבצים בינאריים, זה הופך לבעיה הרבה יותר משמעותית. יש עשרות הפצות, כל אחת מגיע במספר גרסאות שונות ומביא אתה חבילות טיפה שונות. לכן, לאדם אחד זה כמעט ובלתי אפשרי לבנות חבילות לכל הפצה אפשרית.</p> <p>בזכות debootstrap היה לי יחסית קל לבנות חבילות deb ל־Debian ו־Ubuntu, אבל המצב הרבה יותר מורכב כשמדובר ב־rpm כי אין דרך קלה לשים את הפצת rpm בספריה ולעשות לתוכה chroot.</p> <p>בהמלצת שגיא בן־עקיבא התחלתי להשתמש ב־<a href="https://build.opensuse.org/">Open Build Service</a> של OpenSuse.</p> <p>האמת, אני מאוד מרוצה! כל מה שצריך זה להעלות Source RPM או קובץ spec, כל השאר ייעשה בצורה אוטומטית: בניה למספר הפצות ופלטפורמות, הכנת מקורות מסודרים ואפילו אתה מקבל repository מסודר.</p> <p>בצורה כזו הכנתי rpmים ל־3 הפצות (Fedora, Suse, CentOS) כולל מספר גרסאות וגם הכל עבור שתי ארכיטקטורות: x86 ו־x86_64.</p> <p><a href="http://download.opensuse.org/repositories/home:/artyom-beilis/">http://download.opensuse.org/repositories/home:/artyom-beilis/</a></p> <p>מה שנותר... להבין כיצד משתמשים בשירות עבור debים</p> </div>