הודעה על מפגש R של הרגע האחרון – יום שני 2017-09-11 (בתל-השומר, הכניסה חינם בהרשמה מראש)

עידכון (2017-09-17): המפגש היה נחמד מאד, תודה רבה למארחים ולמשתתפים (הגיעו כ- 15 משתתפים). להל"ן הקישורים המעודכנים למצגות שהועברו במפגש:

בשבוע הבא, ביום שני, נקיים מפגש R של הרגע האחרון! קודם אתן פרטים על האירוע, ואז אסביר מדוע אני מודיע על זה רק עכשיו, ולאחר מכן מופיעים תקצירי ההרצאות וביוגרפיה של המרצה.
מתי: ביום שני בעוד שלושה ימים (2017-09-11). נתכנס במקום ברבע ל-7 (בערב!), וההרצאות יתחילו ב-7 (בערב!). תהיה הרצאה של כ-45 דקות, הפסקה של בין 20 ל- 30 דקות, ואז עוד הרצאה של כ-45 דקות.
איפה:  בבית חולים תל השומר (רמת גן) באודיטוריום במרכז למחלות אוטואימוניות (הנחיות הגעה מפורטות מופיעות בקובץ שניתן להוריד מכאן). תודה רבה ל- Shmulik Tiosano על העזרה במציאת מקום בדקה ה-90.
שפה: ההרצאות יועברו בשפה האנגלית.
הרשמה: עליכם למלא פרטים בטופס שבקישור שכאן. אנא מלאו את הטופס בהקדם כדי שנדע שיש מספיק אנשים שמעוניינים להגיע כדי לקיים את המפגש. כמו כן, בגלל שהמפגש אורגן ממש ברגע האחרון, יש מיגבלה חמורה יותר של מקום (בדרך כלל יש מקום ל- 120 איש, הפעם יהיה מקום למקסימום 80 איש).
נושא: (תקצירים מורחבים מופיעים בסוף הפוסט הנוכחי) ההרצאות במפגש יועברו על ידי קיריל מולר ויעסקו בשני נושאים. ההרצאה הראשונה תעסוק בכלי בשם remake לסיוע במחקר בר שיחזור (שאלתי את קיריל למה מי שמשתמש ב knitr צריך משהו כזה, תשובתו הייתה: It's a bit like knitr's caching, but with much better cache invalidation. Also the name is cooler ;-)), ההרצאה השניה תעסוק ב tidyverse (סט החבילות שכולל חבילות ידועות כמו dplyr, ggplot2, tibble, DBI, lubridate ועוד ועוד). קיריל הוא אחד התורמים לחבילות הללו, והוא ידבר עליהן קצת עם דגשים על דברים שהוא עוסק בהם.

למה אתה מספר לנו על זה רק עכשיו??

המממ, ובכן. ראשית, נאמר משהו על המרצה של המפגש. את קיריל מולר פגשתי בכנס R העולמי שהתקיים השנה בבלגיה, וגם בכנס R שהיה לפני שנתיים. מעבר להיותו אדם נחמד ביותר, קיריל הוא משתמש R רציני אשר זכה במלגה מכובדת (כ- 25,000$) של ה R consortium על מנת להרחיב את חבילת ה- DBI כך שתתמוך בעוד בסיסי נתונים. הוא גם עובד בשיתוף פעולה עם חברת RStudio בייעוץ ותכנות, ומעביר סדנאות על ה tidyverse. בקיצור, אדם מעניין.
שלשום פנה אלי קיריל (המרצה של המפגש) במייל, וסיפר לי שהוא הגיע לישראל ושאל אם אני ארצה להיפגש איתו בשביל להסתובב בתל אביב ולקשקש. נפגשתי איתו אתמול. במהלך המפגש שוחחנו על מה שהוא עושה וחשבתי שזה יכול לעניין משתמשי R נוספים בארץ. שאלתי אותו אם הוא יהיה מעוניין להעביר הרצאה על הפרוייקטים שלו למשתמשי ה-R בישראל, והוא אמר שהוא ישמח. עם זאת, הוא פה רק עד יום רביעי בשבוע הבא, כך שלוחות הזמנים היו קצת צפופים מכפי שהייתי מעוניין. בזכותו של שמוליק מצאנו מקום לאירוח המפגש, ואני וקיריל נהיה שם. אני מקווה שגם אתם. להל"ן התקצירים של שתי ההרצאות שקיריל יעביר במפגש.

Talk 1 – Reproducible computational workflows with "remake"

Reproducible computational workflows are an important part of modern science: they enable you, your future self, or another person run your code and achieve the original results. When setting up a reproducible workflow, a tension between three conflicting targets occurs. Often, the only way to make sure that the code is reproducible actually requires running it from start to end. For code that runs longer than about 10 seconds (the average attention span of a human), rerunning all over again becomes impractical when working interactively. To avoid long run times, the code can be run piecemeal, which in turn complicates running the code from start to end. (We're taking for granted that the entire process must be scripted in the first place.)

The "remake" package by Rich FitzJohn is a solution to these problems. It allows defining a workflow as a set of targets (R objects or files, e.g. knitr reports) with dependencies (other targets or files). A target is computed by evaluating an R function. The system figures out automatically which targets need to be rebuilt based on recent changes to your code or your data (thus avoiding full recomputation), while maintaining the ability to develop code interactively. (Users familiar with "make" or other build systems will recognize the concept, but "remake" is much better suited for R projects than traditional "make".) A data analysis based on remake will always be fully reproducible, including those times when you realize, two days before delivery, that your data cleansing code has a crucial error.

Slides: https://krlmlr.github.io/remake-slides/

Tutorial: https://github.com/krlmlr/remake-tutorial

Talk 2 – The "tidyverse" and "DBI": A peek under the hood

Over the past twenty years, R has evolved to a very stable and mature system for statistical computing and graphics. Thanks to its packaging system and thanks to CRAN, which now hosts over 10,000 packages, most practical data analyses can be implemented with little effort solely in R, from importing, loading from a database, web scraping or web API access to cleaning, transforming, exploring, modeling, and finally communicating with static or dynamic documents, web sites, or interactive dashboards. The tidyverse [1] is a coherent set of packages that aims at covering many of these tasks. This informal presentation showcases a choice of tidyverse (and other) packages for data manipulation and database access, and sketches some of their features and limitations.

[1] http://www.tidyverse.org/

Link to remake: https://github.com/richfitz/remake

Speaker's Short Bio

Kirill has a computer science background with some exposure to applied statistical modeling, and enjoys contributing to the R ecosystem as a self-employed software engineer, data science consultant, and trainer. He improves, maintains, and reviews several R packages (dplyr+tibble, DBI+RSQLite+RMariaDB, styler, …), and applies these tools in practical settings to understand where they can be improved. His teaching portfolio includes a two- to three-day tidyverse course.

 

סייגים

כרגיל, אין לנו ביטוח או דברים דומים. עליכם יש אחריות מלאה לכל דבר הקשור בכם, החל בנזק לעצמכם, לאחרים, לרכוש וכן הלאה. אז בבקשה תהיו זהירים.

פורסם בקטגוריה מפגשי R. אפשר להגיע לכאן עם קישור ישיר.

2 תגובות בנושא הודעה על מפגש R של הרגע האחרון – יום שני 2017-09-11 (בתל-השומר, הכניסה חינם בהרשמה מראש)

  1. מאת מור רובינשטיין‏:

    זה בשבע בבוקר או בערב

השאר תגובה