עבור כל אלה שיש להם בכתובות ה URL מילים בעברית הן כתיקיות והן כשמות הדפים. נכון להיום (אפריל 2010) גוגל אנליטיקס לא יודע להציג את כתובות ה URL שלכם בעברית ובמקום זאת הוא מציג אותם כג'יבריש. הבעיה נובעת (מישהו אמר מיקרוסופט?) מכך שדפדפן אינטרנט אקספלורר איננו יודע להציג תווי עברית והופך אותם לסימני אחוזים ואותיות באנגלית, אמנם יש שמועה שבגרסה החדשה של הדפדפן תיפתר הבעיה אבל עד אז אתם מוזמנים לקרוא את הפוסט וליישם אצלכם באתר ולגייר את גוגל אנליטיקס שיידע לכתוב גם עברית.
אגב, אם אתם ממש מוכשרים ויודעים לזהות את הסימנים האלה ולהפוך אותם בראש בחזרה לכתובות בעברית אז הפוסט הזה הוא לא בשבילכם
אבל אם למשל אתם רואים כתובת כזו באנליטיקס
/%d7%94%d7%90%d7%aa%d7%a8-%d7%a9%d7%9c%d7%9a-%d7%91%d7%a2%d7%95%d7%a0%d7%a9-%d7%a7%d7%95%d7%93%d7%9d-%d7%9b%d7%9c-%d7%aa%d7%a8%d7%92%d7%a2-2/
אז חוץ מזה שנראה שמצאנו את הנוסחה לחישוב פייג'ראנק. בעצם רשום פה בעברית: האתר שלך "בעונש" קודם כל תירגע… והנה פוסט עבור אלה שחושבים שגוגל העניש אותי מאת יולי.
אז אחרי שהבנו שלא חטפנו אף עונש הגיע הזמן גם לראות את הדף הזה באנליטיקס כמו שצריך. אז איך עושים את זה ? הכירו את הפילטר Search and Rreplace
פילטר Search and Rreplace
הפילטר נועד כדי לבצע מניפולציות טקסט על המידע המוצג לנו המשתמשים והוא מאוד פשוט לבנייה.
אז איך בונים פילטר Search and Replace עבור הדוגמה שהוצגה מקודם
- נכנסים למנהל הפילטרים ומוסיפים פילטר חדש
- נותנים שם לפילטר ובוחרים ב custom filter
- מסמנים את Search and Replace
- בוחרים ב Filter Filed את הערך Request URI (שני מלמעלה)
- ב Search String נדביק את כל הג'יבריש
- ואיפה שרשום Replace String נשים את המילים "האתר בעונש, תירגע"
- נבחר את הפרופילים בהם נרצה לבצע את ההחלפה ונאשר.
זהו. מעכשיו בכל פעם שמישהו יגיע אל העמוד הזה, גוגל אנליטיקס ייקח את הג'יבריש ויחליף אותו בכותרת בעברית שגם אנחנו יכולים לקרוא.
כמובן שאם יש לנו בלוג או אתר עם הרבה תוכן וגם כל הזמן מתווספים עוד מאמרים אז שימוש בשיטה הנ"ל יכול להיות קצת בעייתי.
טיפ – השתמשו בביטויי רגקס (Regex) על מנת לייעל את תהליכי החלפת הביטויים
שימושים נוספים לפילטר
אם יש לנו תיקייה מובילה שנמצאת בכל האתר והיא איננה תורמת לנו להבנה ובעצם סתם תופסת שטח בדוחות אז פשוט ניתן להוריד אותה. אצלי בבלוג הורדתי את תיקיית הבלוג מדוחות האנליטיקס ובמקומה שמתי סלאש.
עוד דוגמה שימושית תהיה לאתרים להם אין כתובות ידידותיות הנה כתובת לדוגמה מאתר זאפ
http://www.zap.co.il/models.aspx?sog=c-pclaptop&db239046=239052
חלק מהכתובת אני מזהה כקטגוריית מחשבים ניידים אבל את db239046=239052 אין לי מושג מה זה אומר. לאחר שיחת בירור עם המתכנת גיליתי שהדבר הזה מייצג את מחשבי אסוס. לכן אצור פילטר שאומר שכל פעם שמופיע הביטוי הזה יש להחליף אותו עם המילה אסוס. זהו, עכשיו עבור כל בני האנוש בכל פעם שנסתכל באנליטיקס ישר נדע למה התכוון המשורר…

אחלה פוסט מאיר.
מה עם איזה פוסט על regex?
חריף! כתובות בעברית מג'וברשת בגוגל אנליטיקס היא בעיה שאני ואתה (ובלי ספק עוד הרבה אחרים) סובלים ממנה כבר המון זמן.
בדיוק עמדתי להציע אותו דבר – פוסט על רג'קס יחמם את הלב…