סדנת R: ניתוח רשתות חברתיות / שאיבת נתונים מויקיפדיה (11.12.2014) (הכניסה חינם, בהרשמה מראש)

בהמשך לסדנת ה-R המוצלחת על R וביג-דטא, אנחנו שמחים להזמין אתכם לסדנת R אשר משלבת שני נושאים: (1) ניתוח רשתות חברתיות, (2) שאיבת נתונים מויקיפדיה (מה שמכונה web-scraping אתי דרך API). הסדנה תתקיים בחסות עמותת ויקימדיה ישראלהאיגוד הישראלי לסטטיסטיקה, וגוגל-קמפוס.
הסדנה תועבר על ידי עפרית לסר ואורן בוצ'מן (ראו בהמשך), ומאורגנת על ידי אבנר קנטור וטל גלילי.
 _
ההשתתפות היא בחינם, אך דורשת הרשמה מוקדמת בשני קישורים (סורי על הריבוי, אך אין ברירה):
1) עליכם ליצור שם משתמש באתר של גוגל-קמפוס (ההרשמה היא בחינם, ובצד הימני העליון של המסך)
2) עליכם להירשם בגוגל-טופס שמופיע בקישור הישיר כאן.
 _
יש הגבלת מקום של 120 איש, אז אנא מהרו להירשם. לאחר שירשמו 120 הראשונים, ישלח אליהם מייל שמודיע שהם "בפנים". לאחר מכן ההרשמה תישאר פתוחה ל"רשימת המתנה", ובשבוע שלפני הסדנא נברר כמה אנשים לא יוכלו להגיע – ונזמין את האנשים מרשימת ההמתנה להגיע. בד"כ כשליש (לפחות) מהאנשים מבטלים ברגע האחרון, אז הרבה מהאנשים של רשימת ההמתנה צפויים לקבל הזמנה להגיע (אז תירשמו :) ).

כיבוד

היות והמפגש בחינם, אין לנו אפשרות לממן כיבוד (מעבר לתה וקפה שמציאים גוגל קמפוס). אי לכך: (1) רצוי שתביאו ארוחת ערב / תאכלו מראש. (2) נשמח אם תביאו כיבוד קל למפגש (פירות/ירקות חתוכים, שתיה או דיברי מתיקה – הכל הולך. עדיף איכות על כמות).

היכן?

בגוגל קמפוס:

ELECTRA TOWER
98 YIGAL ALON ST.
TEL AVIV
34TH FLOOR

מתי?

הסדנה תתקיים ביום חמישי, ה-11.12.2014 בין השעות 18:30-21:30

לו"ז (טנטטיבי):

  • 18:30-19:00 התכנסות
  • 19:00-20:00 – עפרית לסר
  • 20:30 – 20:00 הפסקה
  • 21:30 – 20:30- אורן בוצ'מן

קהל היעד?

משתמשי R.

נושאי הסדנא

רקע:

המחקר האקדמי בנושא ויקיפדיה הולך וגובר בשנים האחרונות. מחקר זה דורש התמודדות עם מספר אתגרים: למידת תרבות העריכה והתנהלות הקהילה, הבנת כללי האתיקה המחקרית של קרן ויקימדיה, פיתוח כלי תוכנה לאיסוף ועיבוד נתונים ושימוש בשיטות מחקר חדישות.

עמותת ויקימדיה ישראל מעוניינת לקדם את השימוש בשפת R לחקר ויקיפדיה (בעברית ובשפות אחרות). ברצוננו ליצור קהילת מפתחים וחוקרים אשר תפגש על בסיס קבוע ותפתח כלים שעל בסיסם יתבצע מחקר. היתרון בסביבת R הן יכולות מתקדמות לניתוח נתונים סטטיסטי, חזותי ואינטגרציה נוחה עם כלים אחרים. שפה זו צוברת פופולריות בקרב סטטיסטיקאים ומהווה חלק מאקולוגית הקוד הפתוח.

להלן נושאי ההרצאות:

Social network analysis with R and igraph

Social network analysis (SNA) is the use of network theory to analyze social networks. SNA provides both a visual and a mathematical analysis of entities relationships. These entities can be people, organizations, countries etc. SNA is a practical method for visualizing such networks, identify powerful individuals, and perform data-mining in order gain further insight on its nature.

This talk presents some basic concepts in SNA, and demonstrates it using R and igraph. igraph is a collection of network analysis tools with the emphasis on efficiency, portability and ease of use. It is open source and free and can be programmed in GNU R (as well as Python and C/C++).

About me: Ofrit Lesser is a PHD student at the Information Systems Engineering department, Ben Gurion University

Scraping Wikipedia using R and RCurl and httr

Wikipedia is the most commonly cited information source in infographics. The organization behind Wikipedia, the WMF, provides a rich API to access many types of structured and semi structured data. As a result most of the edits on Wikipedia today are performed using automated scripts called robots. To get at real-time version of information you will have to resort to "good old" scraping techniques.

This talk presents RCurl and httr are used to solve many challenges of scraping a website. I will discuss some of the technical challenges of using RCurl to build high level API based functionality as well as the other glue needed to scrape pages – (debugging, testing, two step authentication and editing). I’ll also touch on the ethics of scraping and provide some alternatives to large scale scraping of Wikipedia.

About me: Oren Bochman has a B.A. in Mathematics & Information Science from Bar Ilan University. Bochman is an open-source developer and contributor to Wikipedia.

פורסם בקטגוריה מפגשי R | להגיב

הרצאה על מחקר-בר-שיחזור (Knitr ושות') ב-12 לנובמבר 2014

להרשמה: http://www.meetup.com/Big-Data-Israel/events/210911512/?a=ea1_grp&rv=ea1&_af_eid=210911512&_af=event

  • Wednesday, November 12, 2014

     to 

  • F5’s Tel-Aviv R&D center

    30th floor, building #8, Kiryat Atidim, Tel Aviv-Yafo (map)

     

  • Target audience: Data analysts, Data Scientists, BI experts, Algorithms Developers, Algorithms Engineers

    Where?

    F5’s Tel-Aviv R&D center: 30th floor, building #8, Kiryat Atidim, Tel-Aviv.

    Agenda:

    1.  17:00-17:30: Arrival and mingling

    2.  17:30-18:30Shlomo Yona: Reproducible Research in R [R markdown, knitr, RStudio,…]

    3.  18:45-19:45Maydan Wienreb: Reproducible Research in Python [Anaconda, IPython, …]

    4.  20:00-21:00Eliran Bivas: Reproducible machines and setups [VirtualBox, Vagrant, Docker, …]

     

    Abstract:

    You will learn how to document our datasets, code, thoughts, attempts and results (intermediate and final) such that we have clear research documentation (as a research notebook, for example) as well as means to reproduce the research in full with a click of a button. To further allow reproducibility, we will also show how you can box your environment such that it can be reconstructed elsewhere so you won’t suffer from the “works on my machine syndrome”.

    We will show concepts and tools behind reporting modern data analyses in a reproducible manner.  This meetup will focus on literate statistical analysis tools which allow one to publish data analyses in a single document that allows others to easily execute the same analysis to obtain the same results.

    What is reproducible research?

    Reproducible research is the idea that data analyses, and more generally, scientific claims, are published with their data and software code so that others may verify the findings and build upon them.  The need for reproducibility is increasing dramatically as data analyses become more complex, involving larger datasets and more sophisticated computations. Reproducibility allows for people to focus on the actual content of a data analysis, rather than on superficial details reported in a written summary. In addition, reproducibility makes an analysis more useful to others because the data and code that actually conducted the analysis are available.

פורסם בקטגוריה מפגשי R | להגיב

סדנת R ו- Big Data בתאריך ה-23.10.2014 (הכניסה חינם, בהרשמה מראש)

עידכון חשוב: ההרשמה התמלאה. עם זאת, אני מעודד אתכם להמשיך ולהירשם (ההנחיות למטה). היות ורק 70 מתוך 120 איש אמרו שהם בוודאות יגיעו למפגש, סביר שיהיו מקומות פנויים רבים. אי לכך, שבוע לפני המפגש אני מתכנן לפנות במייל למשתתפים על מנת לוודא שהם מגיעים, ואנשים שירשמו ל"רשימת ההמתנה", יקבלו מייל עם אישור שיהיה מקום עבורם להגיע.

ההרשמה

בהמשך לסדנת ה-R המוצלחת על knitr ו- shiny,
אנחנו שמחים להזמין אתכם לסדנה בנושא R ו- Big Data, בחסות  האיגוד הישראלי לסטטיסטיקה, וגוגל-קמפוס.
הסדנה תועבר על ידי ד"ר יונתן רוזנבלט ממכון וויצמן, ואדי אהרונוביץ מאוניברסיטת תל אביב.
ההשתתפות היא בחינם, אך דורשת הרשמה מוקדמת בשני קישורים (סורי על הריבוי, אך אין ברירה):
1) עליכם ליצור שם משתמש באתר של גוגל-קמפוס (ההרשמה היא בחינם, ובצד הימני העליון של המסך)
2) עליכם להירשם בגוגל-טופס שמופיע בקישור הישיר כאן.
יש הגבלת מקום של 120 איש, אז אנא מהרו להירשם. לאחר שירשמו 120 הראשונים, ישלח אליהם מייל שמודיע שהם "בפנים". ההרשמה התמלאה. לאחר מכן ההרשמה תישאר פתוחה ל"רשימת המתנה", ובשבוע שלפני הסדנא נברר כמה אנשים לא יוכלו להגיע – ונזמין את האנשים מרשימת ההמתנה להגיע. בד"כ כשליש (לפחות) מהאנשים מבטלים ברגע האחרון, אז הרבה מהאנשים של רשימת ההמתנה צפויים לקבל הזמנה להגיע (אז תירשמו :) ).

היכן?

בגוגל קמפוס:

ELECTRA TOWER
98 YIGAL ALON ST. 

TEL AVIV 
34TH FLOOR

מתי?

הסדנה תתקיים ביום חמישי, ה-23.10.2014 בין השעות 17:00-21:30

לו"ז (טנטטיבי):

  • 17:00-17:30: הגעה ומינגלינג
  • 17:30-19:00: יונתן רוזנבלט
  • 19:00-19:30: הפסקה
  • 19:30-21:00: אדי אהרונוביץ
  • 21:00-21:30: זמן אקסטרא לשאלות ומינגלינג

קהל היעד?

משתמשי R.

נושאי הסדנא?

ד"ר יונתן רוזנבלט

Whether you call it "BigData", "massive data", "huge data" (see here) etc. Many observations with many variables present a computational challenge.
SAS, SPSS, and Revolutions provide fast and efficient implementations of out-of-memory algorithms for fitting statistical models.
In this talk, I will present several open source implementations of these algorithms available as R packages. These include LiblineaRRSofia, and others (time permits).

אדי אהרונוביץ'

The obvious way to process data is within the local computer, however, when we talk about analyzing “BigData”, we might face the usual compute and storage problems in an intensified manner.
In this talk, an overview of the existing techniques to process distributed data and their R implementations will be presented.
No previous computer science knowledge is needed.

פורסם בקטגוריה מפגשי R | להגיב

2014-05-30 – סיכום סדנת R (מבוא ל- knitr ו- Shiny)

R_01_2014-05-30

אתמול קיימנו מפגש משתמשי R בנושאי knitr ו- shiny באוניברסיטת תל אביב. היה מקסים. הגיעו כ-60 משתתפים אשר הביאו איתם עוגיות טעימות, דובדבנים – ובעיקר – אווירה נעימה של חברותיות וסקרנות.

אתם מוזמנים להוריד את קבצי ההרצאות:

אני אשמח לקדם מפגש נוסף שכזה בעוד כמה חודשים (בין 4-7 חודשים מעכשיו), אם אתם מעוניינים לקבל עידכונים על כאלו מפגשים בעתיד, אתם מוזמנים להוסיף עצמכם לרשימת התפוצה, ובנוסף יש גם קבוצת פייסבוק.

אם אתם מעוניינים להרצות באחד המפגשים העתידיים, או לכתוב פוסט באתר הזה לגבי העבודה שלכם ב-R, אנא שילחו לי אימייל אל:  tal.galili@gmail.com. הנטייה שלי היא להרצאות של בין חצי שעה לעד שעה וחצי (תלוי בכמות החומר שיש לכם). עדיף הרצאות שהן self-contained, כך שגם מישהו מחוץ לתחום שלכם יוכל להבין את כל מה שתציגו, ועדיף שההרצאה תאפשר למשתמשים ליישם את הנלמד בכוחות עצמם.

אני רוצה להודות שוב לכל האנשים שהגיעו (ואלו שניסו להגיע), לאיגוד הסטטיסטיקה הישראלי (דוד שטיינברג, רון קנט, יאיר גולברג) ולאוניברסיטת תל אביב (מיכל זהר, ענת קורן, נורית ליברמן) – על תמיכתם במפגש ועידוד השילוב המקסים הזה של קוד פתוח, אקדמייה, תעשייה ואנשים טובים.

ולסיום, אני רוצה להזכיר שבעוד פחות משבועיים יתקיים כנס איגוד הסטטיסטיקה הישראלי ב-2014-06-11 בקריית האוניברסיטה הפתוחה ברעננה (עם תכנים מאד מעניינים) – לחצו כאן לפרטים נוספים.

פורסם בקטגוריה מפגשי R | להגיב

2014-05-30 – סדנת R: מבוא ל- knitr ו- Shiny (באונ' ת"א, בחינם)

האיגוד הישראלי לסטטיסטיקה שמח להזמין אתכם לסדנת R,
בהנחיית טל גלילי ושלומי ליפשיץ, מהמחלקה לסטטיסטיקה וחקר ביצועים, אוניברסיטת תל אביב.
ההשתתפות היא בחינם, אך דורשת הרשמה מוקדמת (הטופס מופיע בסוף הטקסט)

היכן?
בניין שרייבר, חדר 006 מדעים מדוייקים, אולם לב דאך 005 (קומת קרקע), באוניברסיטת תל אביב. בשעה 9:00 ניאסף מול בניין שרייבר (מתמטיקה) ונלך ביחד לאולם לב דאך (אפשר לחפש את בניין שרייבר במפה כאן).

מתי?

הסדנה תתקיים בתאריך ביום שישי, ה-30.5.2014 בין השעות 9:30-13:00,

קהל היעד?

הסדנא מיועדת למשתמשי R, ללא דרישות מיוחדות לידע מקדים (מלבד זה שכבר התקנתם את R, ורצוי גם את RStudio, על מחשבכם).

נושאי הסדנא?

הסדנה תארך כ-3 שעות (עם חצי שעה הפסקה באמצע), אשר יחולקו בין שני נושאים:
א) יצירת מסמכים ברי-שיחזור באמצעות R+knitr
ב) בניית אפליקציות סטטיסטיות באמצעות R+Shiny
חלק א' – של הסדנה יועבר על ידי טל גלילי (דוקטורנט לסטטיסטיקה באונ' תל אביב), ויעסוק בדרכים שבהם ניתן לייצא פלטים מ-R. נתחיל מלסקור שיטות יחסית מוכרות (כמו copy-paste, write.table וכו', אבל עם כל מיני טוויסטים), נעבור לדון בתיעוד קוד ומשם נצלול לעולם של מסמכים-ברי-שיחזור ( המכונים גם: literature programing / provenance / reproducible research).
הסדנה תתמקד בשימוש ב- knitr (היורש של Sweave), עם וללא RStudio, באמצעות rmarkdown ו- LaTeX (בהינתן הזמן).
בשילוב עם דרכים שונות לשלוט בפלטים המוצגים (החל מטבלאות, מודלי רגרסיה/אנובה וכמובן תרשימים). שליטה בפרמטרים שונים (כגון המטמון של אובייקטים), כמו גם בדרכים להמיר את הפלטים לפורמטים שונים (HTML, PDF, DOCX וכו')
בחלק הראשון של הסדנא גם נדגים את השימוש בחבילת ה dendextend החדשה, אשר מיועדת לעבוד עם אובייקטי ה dendrogram של R (אשר משמשים לייצג עצים היררכיים, בעיקר בשביל קלאסטרינג היררכי).
חלק ב' – של הסדנה יועבר על ידי שלומי ליפשיץ (דוקטורנט לסטטיסטיקה באונ' תל אביב). תקציר להרצאת :Taking a shine to Shiny
Shiny is a R package for sharing statistical analyses on the web as an interactive report.
It can also be used as a simple tool for building web-base R applications.
The talk will introduce Shiny through examples and assume basic knowledge of R.

הרשמה (נסגרה)

 

 

פורסם בקטגוריה מפגשי R | עם התגים , , , | להגיב

מפגש מבוא לשפת R עבור משתמשים טריים במשרדי Outbrain בנתניה

שלמה יונה מקדם מפגש מבוא לשפת R במשרדי outbrain בנתניה ליום שני בעוד שבוע. להל"ן הפרטים כפי שהופיעו בבלוג של שלמה:


היכן?

משרדי חברת אאוטבריין, קומה 2, אריה רגב 6, אזור התעשייה פולג, נתניה.


View משרדי אאוטבריין in a larger map

מתי?

ביום שני, 14 במאי, 2012, בשעה 16:15 נפגשים ובשעה 16:30 מתחילים בהרצאה. מתפזרים ב-18:30.

מה הנושא?

מבוא ל-R לשימושי Machine Learning

מי מרצה?

שלומי ליפשיץ, דוקטורנט במחלקה לסטטיסטיקה באוניברסיטת תל-אביב. בעבודתו, מפעיל שלומי שיטות Machine Learning על תמונות רפואיות. כמו כן, שלומי מלמד בשנתיים האחרונות את הקורס ״מבוא למחשבים לסטטיסטיקאים״ אשר בו נלמדת שפת R.

מה הרקע הנדרש?

הנחת היסוד שיש ידע כלשהו בתכנות והבנה מה זה (גם אם אין יודעים איך עושים את זה) Machine Leraning. אין צורך בידע מוקדם על R.

מי קהל היעד?

משתמשי R בהווה, מי שמעוניינים להתחיל להשתמש ב-R, סטטיסטיקאים, מתכנתים, אנליסטים. הכוונה שלנו לייצר קהילה של משתמשי R בארץ.

יש כיבוד?

כן.

יש חנייה?

כן. אפשר לחנות בחניון של מרכז יכין אלכסנדרה או ברחוב אריה רגב.

יש אתר לעדכונים?

כן. עדכונים בנוגע למפגשי הקבוצה אפשר לקבל על ידי הצטרפות לרשימת התפוצה

איך מאשרים הגעה?

שולחים דוא"ל לשלמה יונה (shlomo@outbrain.com) ומאשרים הגעה. מי שאינו בטוח שיגיע, נא לציין זאת, כדי שנוכל להתארגן כראוי.

אם אתם מעוניינים לארגן מפגש R באיזורכם, אנא שילחו פרטים על כך לטל גלילי (על ידי משלוח אימייל ל: tal.galili@gmail.com), כדי שאוכל לפרסם אודות האירוע כאן.

פורסם בקטגוריה מפגשי R | עם התגים , , | להגיב

האתר הוקם!

כדאי לכתוב כמה מילים על האנשים והמטרות וכדומה. מדובר בטקסט שיופיע כאן, וגם פעם נוספת באודות.

פורסם בקטגוריה חדשות | להגיב