번역] Tidy Tuesday 이벤트에 대한 소개

원문: TidyTuesday GitHub Repository

tidytuesday-logo


A weekly social data project in R


R 생태계를 겨냥한 주단위 데이터 프로젝트. 이 프로젝트는 R4DS 온라인 학습 커뮤니티R for Data Science 책에서 태어났으며, tidyverse 생태계 안에 있는 ggplot2, tidyr, dplyr 등을 이용해서 데이터를 요약하고 정리해서 의미있는 차트를 만드는 데에 방점을 둡니다. 그렇다고 해서 다른 코드를 사용하면 안 된다는 규칙은 없지만, 그 결과를 만드는 데에 사용한 코드는 공유해주기 바랍니다.

매주 열리는 R4DS 온라인 학습 커뮤니티#TidyTuesday 에 참가해보세요! 매주 원본 데이터와 그 데이터셋과 관련된 차트나 기사를 올려드리니 여러분께서는 그 데이터를 탐색하시면 됩니다. 데이터셋을 “길들일” 수는 있지만, 항상 정리가 된 것은 아닐 겁니다! 그렇기 때문에 여러분은 데이터를 진정한 정리된 형태로 만들기 위해 다양한 R for Data Science 기법을 사용해야할 겁니다. TidyTuesday 의 목적은 여러분의 R 스킬을 적용하고, 피드백을 받고, 다른 사람의 작업물을 살펴보고, 더 큰 #RStats 커뮤니티와 관계를 맺는 것입니다! 그렇기 때문에 저희는 다양한 기술을 가진 다양한 사람들이 참가하기를 독려합니다!

저희는 다양한 출처에서 데이터를 가지고 올 것이며, 그 어떤 인과관계도 내포하고 있지 않다는 것을 강조하고 싶습니다. 모든 데이터에 영향을 주는 다양한 조절변수가 있으며, 이것들 중 다수가 데이터셋 내에 제대로 집계되지 않았을 수 있습니다. 그렇기 때문에 저희는 제공된 데이터를 데이터 정리와 차트를 그리는 기술을 연마하는 데에만 사용하시길 권합니다. 참가자들은 스스로 어떤 미묘한 요인 (nuancing factors) 가 이러한 관계 아래에 깔려있는지 생각해야 합니다.

Tidy Tuesday 의 의도는 결론을 도출하는 것과는 무관하게 개인들이 스스로 데이터 전처리와 시각화 연습을 할 수 있도록 안전하고 서로 지원해주는 장을 만들기 위함입니다. 이 둘이 관련이 있다는 것을 저희도 이해하고 있으나, 이 연습의 목적은 순수하게 실제 데이터를 가지고 연습하는 것입니다.

모든 데이터는 월요일에 data sets 페이지에 올라갈 것입니다. 데이터와 함께 문맥을 파악할 수 있도록 원문도 같이 포함할 예정입니다.

저희는 모든 초심자, 열정이 있는 사람, 그리고 전문가가 참여하도록 환영합니다. 하지만 몇 가지 명심해주셨으면 하는 게 있습니다.

  1. 데이터셋은 원문 또는 원문이 인용한 출처에서 가져왔습니다. 데이터는 있는 그대로 받아들이시고, Tidy Tuesday 는 여러분이 R 을 이용해서 기본적인 데이터 전처리와 시각화를 연습하는 것을 돕기 위해 만들어졌다는 걸 기억해주세요.

  2. 다시 한 번 말씀 드립니다. 데이터는 그게 다입니다! 여러분이 제공된 데이터 이외에 더 탐색하는 것을 환영합니다만, 이 데이터는 연습을 위해 제공된 “장난감 (toy)” 데이터입니다.

  3. 이 프로젝트는 남을 비평하는 것도, 동료 #RStats 사용자와 그의 코드를 뜯어보는 게 목적이 아닙니다! 서로를 지지하고 친절하게 대하세요! 다른 사람의 글에 좋아요도 눌러주시고, #RStats 커뮤니티를 널리 알리는 것을 도와주세요!

  4. 여러분이 스스로 코드를 짰고 이를 공유할 때에는 트위터에서 #TidyTuesday 해시태그를 꼭 붙여주세요.

  5. 트위터에 글을 쓸 때에는 시각화한 것의 사진을 같이 올려주세요.

  6. 트위터에 글을 쓸 때에는 시각화에 사용한 코드도 같이 올려주세요. 본인과 다른 사람이 자신의 프로세스를 이해하는 것을 도울 수 있도록 가능하다면 코드에 주석을 달아주세요.

  7. 비록 쉬운 것으로 끝냈더라도 여러분의 작업물을 개선하는 것에 집중해주세요!

  8. 가능하다면 원본 데이터의 출처에 감사를 표해주세요.


데이터셋 제출하기


흥미로운 데이터셋을 제공하고 싶으신가요? 이슈 를 열어서 데이터를 사용한 글 (또는 블로그 글 등) 의 링크를 달아주세요. 그런 뒤에 향후의 TidyTuesday 행사에 이 데이터를 추가할 지 이야기 해보시죠!


코드 제출하기


유용한 코드를 제출하고 싶다고요? 풀 리퀘스트 (Pull Request) 형태로 제출해주시고 가이드 를 꼭 지켜주세요.

2020

사내 스터디에 대한 회고

1 minute read

회사 서비스의 추천 시스템을 개선하기 위해 팀 내에서 (아직까진 두 명이긴 하지만) 지난 두 달 동안 스터디를 진행했습니다. 얼마 전 두 번째 스터디가 끝났고 이에 대한 회고를 해보려고 합니다.

Back to top ↑

2019

GitHub 블로그에 Jupyter notebook 올리는 방법

3 minute read

여러분의 GitHub 블로그에 Jupyter notebook 을 바꿔서 올릴 수 있도록 도와줄 글이다. 직접 바꾸는 방법은 1회성 글들을 위해서 추가했고, 변환 과정과 파일 이동, 그리고 여러분의 블로그에 올리는 것까지 한 번에 할 수 있는 자동화 bash 를 만드는 자세한 방법...

Back to top ↑

less than 1 minute read

1 minute read

Back to top ↑
0 Comments