האקתון Rאשון על מחירי מזון בישראל – מה היה ותוכניות להמשך

photo

אתמול קיימנו בגוגל קמפוס ("קמפוס תל אביב"), מפגש מרתק שנמשך משש בערב ועד עשר בלילה. למפגש הגיעו למעלה מ-20 משתתפים, אשר הגיעו ושמרו על ריכוז למרות החום (המזגן בחדר התקלקל). השעתיים וחצי הראשונות הועברו על ידי יוני סידי אשר עבר באופן פרטני על גישה למבנה הגולמי, שליפה, תירגום XML ל dataframe, עבודה עם sqlite והצגת מפות אינטראקטיביות. בשעה וחצי שנותרו היה זמן חופשי לאנשים לחקור את המאגר בסיוע המשתתפים האחרים והמנחה.

להלן קישורים לקבצים התוכן אשר הועברו במפגש:

ומה הלאה?

זה היה הניסיון הראשון שלנו במפגש שהוא לא רק הרצאה, וסך הכל נראה שהתגובות של אנשים היו חיוביות. אנשים שאלו שאלות, ונשארו לשחק עם הנתונים לאחר המפגש.

הדברים שנרצה לעשות להמשך הם:

1) לקיים מפגש נוסף (הפעם שיכוון לא ל- 30 איש, אלא ל- 100+) בה תינתן הרצאה על הנושא של dplyr (וגם יישומה בהקשר של הנתונים שלנו),

2) להתחיל סידרה של מפגשי R קבועים, אחת לחודש. במפגשים אלו נוכל להגיע ולשחק עם נתונים כאלה או אחרים לטובת הקהילה. בתור התחלה, דרך קידום הפרוייקט של מחירי המזון בישראל.

 

פורסם בקטגוריה מפגשי R | תגובה אחת

מה מתוכנן להאקתון R מחירי רשתות של שבוע הבא (המתקיים ב-4 לאוגוסט ומתחיל ב-18:00)

בשבוע הבא יתקיים ביום שלישי האקטון R על מחירי המזון ברשתות השיווק. נותרו עוד (מעט!) מקומות פנויים במפגש, ואתם מוזמנים להירשם כאן בכדי להודיע לנו שאתם מגיעים.

מאז שהכרזנו על המפגש ועד עכשיו, עבדנו הרבה מאד כדי להתכונן למפגש (כלומר, יוני סידי עבד קשה – בעוד שאני בעיקר נהניתי לראות את הדברים המדהימים שהוא עשה).

נתוני המחירים מפוזרים בקבצי xml על פני אתרים רבים, יוני עמל רבות בשביל לאחד את כולם לקובץ אחד. יום אחד של נתונים הוא בערך 2.5GB (לא כל כך כיף בשביל עבודה עם R). לשם כך, יוני ריכז את הנתונים בתוך קובץ SQlite אשר ניתן לקרוא לתוך R, לשלוח לו פקודות SQL או לעבוד מולו בעזרת dplyr (הנחיות נוספות יינתנו למי שירשם כאן למפגש). את הנתונים ניתן לשלב עם מיקומי חנויות על פני מפה (מיקומים אשר לא ניתנו בקובץ נוח, ויוני נדרש לשאוב מאתרים שונים, ולעשות עליהם לא מעט הכנות בשביל שהם יהיו בפורמט אחיד). הנה דוגמא לצילום מסך של מפה אינטראקטיבית אשר יוני יצר על בסיס הנתונים (באפשרותכם להקליק על התמונה בשביל קובץ HTML עם המפה האינטראקטיבית בתחתיתו, כמו גם הקוד R אשר יצר אותה):

2015-07-31 11_49_55-Clipboard

כדי לעזור לכם לדעת עוד על מה מתוכנן, ואיך הגענו לכאן, יוני כתב כמה מילים ששווה לקרוא, להתראות שבוע הבא:

Last month a new law went into affect forcing all the major Israel Supermarket Chains to publish all prices and promotions so consumers can compare prices and lower prices through transparency. The full info of the law can be found [here].
The files instead of being in held in a centralized site in an easily read format for the public are spread out in many private sites in nonuniform archived xml files. The idea behind such a bad storage and formatting scheme is that the government wanted to have private companies make apps so the consumers can access the data through a third party.
The files format and generic layout can be found [here]. In reality the chains did not abide by the generic format and xml's have different structures and column attributes. Just to get a general idea of how much data is being sent every day, just the prices (smaller than the promotions file) take up 3 gigabytes of data per day.
While comparing items on an application is an important short term goal for the government and the law it is in our opinion only a first step. We are looking to bring the data to research quality data and add external information to supplement the information supplied by the chain stores.
We set out to incorporate multiple disciplines and agencies in this project to take advantage of each fields expertise. We have cooperation of representatives from the the Workshop for Public Information, Givat Ram Computer Science Department of the Hebrew University, the Statistics Departments of Tel Aviv University and the Hebrew University, the Geography Department at the Hebrew University, the Research Department in the Bank of Israel and the Central Bureau of Statistics.
Our current goals for the upcoming hackathon meeting are to get a good base for future work. This entails organizing all addresses of stores and incorporating it into a GIS system, creating a classification hierarchy of products in order to define uniform product baskets, and set up a sampling methodology that represents geographical units such that not all the data will be needed to conduct research.
פורסם בקטגוריה מפגשי R | להגיב

האקתון R מחירי רשתות השיווק ב-4 לאוגוסט (יום ג') בין 18:00 בערב ועד ל- 22:00

שלום כולם,
אנחנו (יוני סידי, אבנר, אנוכי, ועוד חברים) שמחים להזמין אתכם להאקתון בנושא מחירי רשתות השיווק.

מפגש האקתון הוא שונה ממפגשי R רגילים בכך שיש בו יחסית מעט זמן "הרצאה" (למרות שבמפגש הנוכחי תהיה הרצאת התחלה בשביל להבין קצת את הנתונים), ומטרתו לאפשר לאנשים לעבוד ביחד (או לפחות האחד ליד השני), על מנת לקדם מטרה משותפת (ראו סילבוס מורחב בסוף הפוסט).

איפה: המפגש יתקיים בגוגל קמפוס בתל אביב:
ELECTRA TOWER
98 YIGAL ALON ST.
TEL AVIV
34TH FLOOR

מתי: ב-4 לאוגוסט (יום ג') בין השעות 18:00 בערב ועד ל- 22:00.

מטרת ההאקטון הקרוב היא לבנות תשתית לביצוע מחקר בנושא מחירי מזון. סילבוס מפורט מופיע לאחר טופס ההרשמה.
משתתפים המעוניינים להגיע, אנא מלאו את פרטיכם בטופס:

The purpose of this meeting is to introduce ourselves to each other, the data and of course R.

From the response to the sign up form people have filled out thus far there are quiet a few fields interested in attending: statistics, computer science, geography, advertising, and more…

Each participant will receive a PDF containing the meta description of the files and a sample of the data retrieved thus far. After we are all on the same page we will split into groups that will have a task to do that serve the overall goal of understanding the data and getting it ready for any future research.

Syllabus

– Background to the Project
–   — What is the purpose of the law
–   — How can researchers and public use the data
–   — How to get to the data: Ministry of Economics homepage
–   — Logging into stores sites to retrieve data
– Exploring the different file types
–   — Summary PDF file that explains the layout and column data types in each file.
–   — Stores: List of all the stores for a given chain
–   — Prices: Updated Prices for all the Items sold in a given store of a chain
–   — Promotions: Updated Promotions for all the Items sold in a given store of a chain
– Getting hands dirty
–   — Recieve sample data to put on personal computer
–   — Creating data.frames from XML files to work on
–   — Implementing some basic queries to get a feel for the files.
– Splitting into Groups
–   — Creating hierarchies and clusters of items found in the prices files through the descriptions labels
–   — Designing sampling methods to retrieve representative samples from the data (statarea/city/national)
–   — Joining separate information to chain stores data: Socioeconomic/Deomgraphic/GIS data

פורסם בקטגוריה מפגשי R | להגיב

האקתון R מחירי רשתות השיווק (ומצגות מסדנת ה- R הקודמת)

שלום כולם. נהנינו מאד מסדנת ה-R שהתקיימה בשבוע שעבר בנושאי ggplot2 והפעלת R ב- Amazon (אשר הועברו על ידי עמית גל וליעד שקל). אתם מוזמנים להוריד את המצגות מהמפגש בקישורים הבאים:

 

אנחנו (יוני סידי, אבנר, אנוכי, ועוד כמה) שוקלים לקיים האקתון בנושא מחירי רשתות השיווק.

מטרת ההאקטון הקרוב היא לבנות תשתית לביצוע מחקר בנושא מחירי מזון. ‫דוגמא לתוצא אפשרי הוא מדד מחירי מזון ברמת האיזור הסטטיסטי. נשמח למשתתפים בעלי יכולות מגוונות. קצת מידע על הפרויקט: https://goo.gl/TgJbQT
אנא מלאו את פרטיכם בטופס בשביל שנוכל לתכנן את תכנית העבודה כך שתתאים ליכולות של המשתתפים. בהתאם לפרטי המשתתפים נתכנן את צעדינו לקיום המפגש:


 

פורסם בקטגוריה מפגשי R | להגיב

סדנת R: וויזואליזציה עם ggplot2 / התקנת RStudio server על שרת אמאזון (18.06.2015) (הכניסה חינם, בהרשמה מראש)

עידכון (2015-06-23): ניתן להוריד את תכני המפגש מהקישורים הבאים:
אנחנו שמחים להזמין אתכם לסדנת R אשר משלבת שני נושאים: (1) וויזואליזציה באמצעות ggplot2 וגם, (2) התקנת RStudio server על שרת אמאזון. הסדנה תתקיים בחסות איגוד הסטטיסטיקאים הישראלי, וגם גוגל-קמפוס.
הסדנה תועבר על ידי עמית גל וליעד שקל (ראו בהמשך), ומאורגנת על ידי אבנר קנטור וטל גלילי (ואנו מתנצלים על ההודעה הקצרה לגבי המפגש).
 _
ההשתתפות היא בחינם, אך דורשת הרשמה מוקדמת בשני קישורים (סורי על הריבוי, אך אין ברירה):
1) עליכם ליצור שם משתמש באתר של גוגל-קמפוס (ההרשמה היא בחינם, ובצד הימני העליון של המסך)
2) עליכם להירשם בגוגל-טופס שמופיע בקישור הישיר כאן.
 _
יש הגבלת מקום של 120 איש, אז אנא מהרו להירשם. לאחר שירשמו 120 הראשונים, ישלח אליהם מייל שמודיע שהם "בפנים". לאחר מכן ההרשמה תישאר פתוחה ל"רשימת המתנה", ובשבוע שלפני הסדנא נברר כמה אנשים לא יוכלו להגיע – ונזמין את האנשים מרשימת ההמתנה להגיע. בד"כ כשליש (לפחות) מהאנשים מבטלים ברגע האחרון, אז הרבה מהאנשים של רשימת ההמתנה צפויים לקבל הזמנה להגיע (אז תירשמו :) ).

כיבוד

היות והמפגש בחינם, אין לנו אפשרות לממן כיבוד (מעבר לתה וקפה שמציאים גוגל קמפוס). אי לכך: (1) רצוי שתביאו ארוחת ערב / תאכלו מראש. (2) נשמח אם תביאו כיבוד קל למפגש (פירות/ירקות חתוכים, שתיה או דיברי מתיקה – הכל הולך. עדיף איכות על כמות).

היכן?

בגוגל קמפוס:

ELECTRA TOWER
98 YIGAL ALON ST.
TEL AVIV
34TH FLOOR

מתי?

הסדנה תתקיים ביום חמישי, ה-18/06/2015 בין השעות 18:30-21:30

לו"ז (טנטטיבי):

  • 18:30-19:00 התכנסות
  • 19:00-20:00 – עמית גל
  • 20:30 – 20:00 הפסקה
  • 21:30 – 20:30- ליעד שקל

קהל היעד?

משתמשי R.

נושאי הסדנא

 

להלן נושאי ההרצאות (ההרצאות יועברו בעברית):

וויזואליזציה באמצעות ggplot2

מטרת ההרצאה להבהיר את ההגיון העומד מאחורי הגישה. רוב ההרצאה שלי תבוסס על המאמר של האדלי אודות הדקדוק הגרפי (קישור).
בהרצאה נציג את חמשת המרכיבים המרכזיים של הדקדוק (מיפוי, גאומטריה, טרנספורמציה סטטיסטית, צירים, קואורדינטות), להבין איך הם משתלבים ביחד תוך מתן דוגמאות, ניתוחן, ומשחק איתן.
ברקע יש את ספרו של האדלי על ggplot שממנו אני שואל כמה רעיונות, וכמה מצגות שמצאתי ברשת שמראות גרפים יפים שאולי אשתמש בהם כדי לנתח את המבנה וההגיון שמאחוריהם.
2015-06-04 00_09_06-Clipboard

 

Rstudio server using Amazon Web Services

Amazon Web Services (AWS) include many different computational tools, ranging from storage systems and virtual servers to databases and analytical tools. For us R-programmers, being familiar and experienced with these tools can be extremely beneficial in terms of efficiency, style, money-saving and more.

In this talk, we will get to know Amazon EC2 service. We will set up an EC2 instance (Amazon virtual server), install an Rstudio server on it and use our beloved Rstudio via browser (all for free!). The talk will include an introduction to linux commands (basic), instructions for connecting to a remote server via ssh and more.

As time permits, we will perform the whole process of establishing a computer cluster for parallel computations fully operated with R and parallel package.

  • No previous knowledge is required.
  • The demonstration is performed online, allowing you to keep track from your laptop.
    This is what you need to do beforehand:
  1. Set up an AWS account (do not worry about the credit card details, you will not be charged for any of  our actions).
  2. Windows users: download MobaXterm (or any other ssh client software).
    Mac users: make sure you are familiar with the terminal (cause I don’t).

סייגים

אין לנו ביטוח או דברים דומים. עליכם יש אחריות מלאה לכל דבר הקשור בכם, החל בנזק לעצמכם או לאחרים וכדומה. אז בבקשה תהיו זהירים.

2013 שנת הסטטיסטיקה הבינלאומית

פורסם בקטגוריה מפגשי R | להגיב

מצגות מסדנאות R (ביג דטא, וניתוח-רשתות-חברתיות/ web scraping)

photo

בחודשים האחרונים קיימנו שני מפגשי R מוצלחים בגוגל קמפוס. למפגש R וביג דטא הגיעו למעלה מ-100 משתתפים ולסדנת ניתוח רשתות ושליפת נתונים מהרשת הגיעו למעלה מ- 80 משתתפים. בשני המפגשים נהנתי מאד מהאווירה של חברותיות וסקרנות, תודה לכל המשתתפים!

אתם מוזמנים להוריד את קבצי ההרצאות:

אני אשמח לקדם מפגש נוסף שכזה בעוד כמה חודשים (בין 4-7 חודשים מעכשיו), אם אתם מעוניינים לקבל עידכונים על כאלו מפגשים בעתיד, אתם מוזמנים להוסיף עצמכם לרשימת התפוצה, ובנוסף יש גם קבוצת פייסבוק.

אם אתם מעוניינים להרצות באחד המפגשים העתידיים, אנא שילחו לי אימייל אל:  [email protected] הנטייה שלי היא להרצאות של בין חצי שעה לעד שעה וחצי (תלוי בכמות החומר שיש לכם). עדיף הרצאות שהן self-contained, כך שגם מישהו מחוץ לתחום שלכם יוכל להבין את כל מה שתציגו, ועדיף שההרצאה תאפשר למשתמשים ליישם את הנלמד בכוחות עצמם.

אני רוצה להודות שוב לכל האנשים שהגיעו (ואלו שניסו להגיע), למרצים, לגוגל קמפוס, לאיגוד הסטטיסטיקה הישראלי, לעמותת ויקימדיה ולאבנר קנטור (המארגן המשותף של המפגש השני) – על תמיכתם במפגש ועידוד השילוב המקסים הזה של קוד פתוח, אקדמייה, תעשייה ואנשים טובים.

עידכון 18/01/2015:  פוסט סיכום על המפגש של אבנר קנטר

פורסם בקטגוריה מפגשי R | 2 תגובות

סדנת R: ניתוח רשתות חברתיות / שאיבת נתונים מויקיפדיה (11.12.2014) (הכניסה חינם, בהרשמה מראש)

בהמשך לסדנת ה-R המוצלחת על R וביג-דטא, אנחנו שמחים להזמין אתכם לסדנת R אשר משלבת שני נושאים: (1) ניתוח רשתות חברתיות, (2) שאיבת נתונים מויקיפדיה (מה שמכונה web-scraping אתי דרך API). הסדנה תתקיים בחסות עמותת ויקימדיה ישראלהאיגוד הישראלי לסטטיסטיקה, וגוגל-קמפוס.
הסדנה תועבר על ידי עפרית לסר ואורן בוצ'מן (ראו בהמשך), ומאורגנת על ידי אבנר קנטור וטל גלילי.
 _
ההשתתפות היא בחינם, אך דורשת הרשמה מוקדמת בשני קישורים (סורי על הריבוי, אך אין ברירה):
1) עליכם ליצור שם משתמש באתר של גוגל-קמפוס (ההרשמה היא בחינם, ובצד הימני העליון של המסך)
2) עליכם להירשם בגוגל-טופס שמופיע בקישור הישיר כאן.
 _
יש הגבלת מקום של 120 איש, אז אנא מהרו להירשם. לאחר שירשמו 120 הראשונים, ישלח אליהם מייל שמודיע שהם "בפנים". לאחר מכן ההרשמה תישאר פתוחה ל"רשימת המתנה", ובשבוע שלפני הסדנא נברר כמה אנשים לא יוכלו להגיע – ונזמין את האנשים מרשימת ההמתנה להגיע. בד"כ כשליש (לפחות) מהאנשים מבטלים ברגע האחרון, אז הרבה מהאנשים של רשימת ההמתנה צפויים לקבל הזמנה להגיע (אז תירשמו :) ).

כיבוד

היות והמפגש בחינם, אין לנו אפשרות לממן כיבוד (מעבר לתה וקפה שמציאים גוגל קמפוס). אי לכך: (1) רצוי שתביאו ארוחת ערב / תאכלו מראש. (2) נשמח אם תביאו כיבוד קל למפגש (פירות/ירקות חתוכים, שתיה או דיברי מתיקה – הכל הולך. עדיף איכות על כמות).

היכן?

בגוגל קמפוס:

ELECTRA TOWER
98 YIGAL ALON ST.
TEL AVIV
34TH FLOOR

מתי?

הסדנה תתקיים ביום חמישי, ה-11.12.2014 בין השעות 18:30-21:30

לו"ז (טנטטיבי):

  • 18:30-19:00 התכנסות
  • 19:00-20:00 – עפרית לסר
  • 20:30 – 20:00 הפסקה
  • 21:30 – 20:30- אורן בוצ'מן

קהל היעד?

משתמשי R.

נושאי הסדנא

רקע:

המחקר האקדמי בנושא ויקיפדיה הולך וגובר בשנים האחרונות. מחקר זה דורש התמודדות עם מספר אתגרים: למידת תרבות העריכה והתנהלות הקהילה, הבנת כללי האתיקה המחקרית של קרן ויקימדיה, פיתוח כלי תוכנה לאיסוף ועיבוד נתונים ושימוש בשיטות מחקר חדישות.

עמותת ויקימדיה ישראל מעוניינת לקדם את השימוש בשפת R לחקר ויקיפדיה (בעברית ובשפות אחרות). ברצוננו ליצור קהילת מפתחים וחוקרים אשר תפגש על בסיס קבוע ותפתח כלים שעל בסיסם יתבצע מחקר. היתרון בסביבת R הן יכולות מתקדמות לניתוח נתונים סטטיסטי, חזותי ואינטגרציה נוחה עם כלים אחרים. שפה זו צוברת פופולריות בקרב סטטיסטיקאים ומהווה חלק מאקולוגית הקוד הפתוח.

להלן נושאי ההרצאות:

Social network analysis with R and igraph

Social network analysis (SNA) is the use of network theory to analyze social networks. SNA provides both a visual and a mathematical analysis of entities relationships. These entities can be people, organizations, countries etc. SNA is a practical method for visualizing such networks, identify powerful individuals, and perform data-mining in order gain further insight on its nature.

This talk presents some basic concepts in SNA, and demonstrates it using R and igraph. igraph is a collection of network analysis tools with the emphasis on efficiency, portability and ease of use. It is open source and free and can be programmed in GNU R (as well as Python and C/C++).

About me: Ofrit Lesser is a PHD student at the Information Systems Engineering department, Ben Gurion University

Scraping Wikipedia using R and RCurl and httr

Wikipedia is the most commonly cited information source in infographics. The organization behind Wikipedia, the WMF, provides a rich API to access many types of structured and semi structured data. As a result most of the edits on Wikipedia today are performed using automated scripts called robots. To get at real-time version of information you will have to resort to "good old" scraping techniques.

This talk presents RCurl and httr are used to solve many challenges of scraping a website. I will discuss some of the technical challenges of using RCurl to build high level API based functionality as well as the other glue needed to scrape pages – (debugging, testing, two step authentication and editing). I’ll also touch on the ethics of scraping and provide some alternatives to large scale scraping of Wikipedia.

About me: Oren Bochman has a B.A. in Mathematics & Information Science from Bar Ilan University. Bochman is an open-source developer and contributor to Wikipedia.

פורסם בקטגוריה מפגשי R | 2 תגובות

הרצאה על מחקר-בר-שיחזור (Knitr ושות') ב-12 לנובמבר 2014

להרשמה: http://www.meetup.com/Big-Data-Israel/events/210911512/?a=ea1_grp&rv=ea1&_af_eid=210911512&_af=event

  • Wednesday, November 12, 2014

     to 

  • F5’s Tel-Aviv R&D center

    30th floor, building #8, Kiryat Atidim, Tel Aviv-Yafo (map)

     

  • Target audience: Data analysts, Data Scientists, BI experts, Algorithms Developers, Algorithms Engineers

    Where?

    F5’s Tel-Aviv R&D center: 30th floor, building #8, Kiryat Atidim, Tel-Aviv.

    Agenda:

    1.  17:00-17:30: Arrival and mingling

    2.  17:30-18:30Shlomo Yona: Reproducible Research in R [R markdown, knitr, RStudio,…]

    3.  18:45-19:45Maydan Wienreb: Reproducible Research in Python [Anaconda, IPython, …]

    4.  20:00-21:00Eliran Bivas: Reproducible machines and setups [VirtualBox, Vagrant, Docker, …]

     

    Abstract:

    You will learn how to document our datasets, code, thoughts, attempts and results (intermediate and final) such that we have clear research documentation (as a research notebook, for example) as well as means to reproduce the research in full with a click of a button. To further allow reproducibility, we will also show how you can box your environment such that it can be reconstructed elsewhere so you won’t suffer from the “works on my machine syndrome”.

    We will show concepts and tools behind reporting modern data analyses in a reproducible manner.  This meetup will focus on literate statistical analysis tools which allow one to publish data analyses in a single document that allows others to easily execute the same analysis to obtain the same results.

    What is reproducible research?

    Reproducible research is the idea that data analyses, and more generally, scientific claims, are published with their data and software code so that others may verify the findings and build upon them.  The need for reproducibility is increasing dramatically as data analyses become more complex, involving larger datasets and more sophisticated computations. Reproducibility allows for people to focus on the actual content of a data analysis, rather than on superficial details reported in a written summary. In addition, reproducibility makes an analysis more useful to others because the data and code that actually conducted the analysis are available.

פורסם בקטגוריה מפגשי R | להגיב

סדנת R ו- Big Data בתאריך ה-23.10.2014 (הכניסה חינם, בהרשמה מראש)

עידכון חשוב: ההרשמה התמלאה. עם זאת, אני מעודד אתכם להמשיך ולהירשם (ההנחיות למטה). היות ורק 70 מתוך 120 איש אמרו שהם בוודאות יגיעו למפגש, סביר שיהיו מקומות פנויים רבים. אי לכך, שבוע לפני המפגש אני מתכנן לפנות במייל למשתתפים על מנת לוודא שהם מגיעים, ואנשים שירשמו ל"רשימת ההמתנה", יקבלו מייל עם אישור שיהיה מקום עבורם להגיע.

ההרשמה

בהמשך לסדנת ה-R המוצלחת על knitr ו- shiny,
אנחנו שמחים להזמין אתכם לסדנה בנושא R ו- Big Data, בחסות  האיגוד הישראלי לסטטיסטיקה, וגוגל-קמפוס.
הסדנה תועבר על ידי ד"ר יונתן רוזנבלט ממכון וויצמן, ואדי אהרונוביץ מאוניברסיטת תל אביב.
ההשתתפות היא בחינם, אך דורשת הרשמה מוקדמת בשני קישורים (סורי על הריבוי, אך אין ברירה):
1) עליכם ליצור שם משתמש באתר של גוגל-קמפוס (ההרשמה היא בחינם, ובצד הימני העליון של המסך)
2) עליכם להירשם בגוגל-טופס שמופיע בקישור הישיר כאן.
יש הגבלת מקום של 120 איש, אז אנא מהרו להירשם. לאחר שירשמו 120 הראשונים, ישלח אליהם מייל שמודיע שהם "בפנים". ההרשמה התמלאה. לאחר מכן ההרשמה תישאר פתוחה ל"רשימת המתנה", ובשבוע שלפני הסדנא נברר כמה אנשים לא יוכלו להגיע – ונזמין את האנשים מרשימת ההמתנה להגיע. בד"כ כשליש (לפחות) מהאנשים מבטלים ברגע האחרון, אז הרבה מהאנשים של רשימת ההמתנה צפויים לקבל הזמנה להגיע (אז תירשמו :) ).

היכן?

בגוגל קמפוס:

ELECTRA TOWER
98 YIGAL ALON ST. 

TEL AVIV 
34TH FLOOR

מתי?

הסדנה תתקיים ביום חמישי, ה-23.10.2014 בין השעות 17:00-21:30

לו"ז (טנטטיבי):

  • 17:00-17:30: הגעה ומינגלינג
  • 17:30-19:00: יונתן רוזנבלט
  • 19:00-19:30: הפסקה
  • 19:30-21:00: אדי אהרונוביץ
  • 21:00-21:30: זמן אקסטרא לשאלות ומינגלינג

קהל היעד?

משתמשי R.

נושאי הסדנא?

ד"ר יונתן רוזנבלט

Whether you call it "BigData", "massive data", "huge data" (see here) etc. Many observations with many variables present a computational challenge.
SAS, SPSS, and Revolutions provide fast and efficient implementations of out-of-memory algorithms for fitting statistical models.
In this talk, I will present several open source implementations of these algorithms available as R packages. These include LiblineaRRSofia, and others (time permits).

אדי אהרונוביץ'

The obvious way to process data is within the local computer, however, when we talk about analyzing “BigData”, we might face the usual compute and storage problems in an intensified manner.
In this talk, an overview of the existing techniques to process distributed data and their R implementations will be presented.
No previous computer science knowledge is needed.

פורסם בקטגוריה מפגשי R | להגיב

2014-05-30 – סיכום סדנת R (מבוא ל- knitr ו- Shiny)

R_01_2014-05-30

אתמול קיימנו מפגש משתמשי R בנושאי knitr ו- shiny באוניברסיטת תל אביב. היה מקסים. הגיעו כ-60 משתתפים אשר הביאו איתם עוגיות טעימות, דובדבנים – ובעיקר – אווירה נעימה של חברותיות וסקרנות.

אתם מוזמנים להוריד את קבצי ההרצאות:

אני אשמח לקדם מפגש נוסף שכזה בעוד כמה חודשים (בין 4-7 חודשים מעכשיו), אם אתם מעוניינים לקבל עידכונים על כאלו מפגשים בעתיד, אתם מוזמנים להוסיף עצמכם לרשימת התפוצה, ובנוסף יש גם קבוצת פייסבוק.

אם אתם מעוניינים להרצות באחד המפגשים העתידיים, או לכתוב פוסט באתר הזה לגבי העבודה שלכם ב-R, אנא שילחו לי אימייל אל:  [email protected] הנטייה שלי היא להרצאות של בין חצי שעה לעד שעה וחצי (תלוי בכמות החומר שיש לכם). עדיף הרצאות שהן self-contained, כך שגם מישהו מחוץ לתחום שלכם יוכל להבין את כל מה שתציגו, ועדיף שההרצאה תאפשר למשתמשים ליישם את הנלמד בכוחות עצמם.

אני רוצה להודות שוב לכל האנשים שהגיעו (ואלו שניסו להגיע), לאיגוד הסטטיסטיקה הישראלי (דוד שטיינברג, רון קנט, יאיר גולברג) ולאוניברסיטת תל אביב (מיכל זהר, ענת קורן, נורית ליברמן) – על תמיכתם במפגש ועידוד השילוב המקסים הזה של קוד פתוח, אקדמייה, תעשייה ואנשים טובים.

ולסיום, אני רוצה להזכיר שבעוד פחות משבועיים יתקיים כנס איגוד הסטטיסטיקה הישראלי ב-2014-06-11 בקריית האוניברסיטה הפתוחה ברעננה (עם תכנים מאד מעניינים) – לחצו כאן לפרטים נוספים.

פורסם בקטגוריה מפגשי R | להגיב