(번역) Tidy Tuesday 이벤트에 대한 소개

tidytuesday-logo

R 생태계를 겨냥한 주단위 데이터 프로젝트. 이 프로젝트는 R4DS 온라인 학습 커뮤니티와 R for Data Science 책에서 태어났으며, tidyverse 생태계 안에 있는 ggplot2, tidyr, dplyr 등을 이용해서 데이터를 요약하고 정리해서 의미있는 차트를 만드는 데에 방점을 둡니다. 그렇다고 해서 다른 코드를 사용하면 안 된다는 규칙은 없지만, 그 결과를 만드는 데에 사용한 코드는 공유해주기 바랍니다.

매주 열리는 R4DS 온라인 학습 커뮤니티의 #TidyTuesday 에 참가해보세요! 매주 원본 데이터와 그 데이터셋과 관련된 차트나 기사를 올려드리니 여러분께서는 그 데이터를 탐색하시면 됩니다. 데이터셋을 “길들일” 수는 있지만, 항상 정리가 된 것은 아닐 겁니다! 그렇기 때문에 여러분은 데이터를 진정한 정리된 형태로 만들기 위해 다양한 R for Data Science 기법을 사용해야할 겁니다. TidyTuesday 의 목적은 여러분의 R 스킬을 적용하고, 피드백을 받고, 다른 사람의 작업물을 살펴보고, 더 큰 #RStats 커뮤니티와 관계를 맺는 것입니다! 그렇기 때문에 저희는 다양한 기술을 가진 다양한 사람들이 참가하기를 독려합니다!

저희는 다양한 출처에서 데이터를 가지고 올 것이며, 그 어떤 인과관계도 내포하고 있지 않다는 것을 강조하고 싶습니다. 모든 데이터에 영향을 주는 다양한 조절변수가 있으며, 이것들 중 다수가 데이터셋 내에 제대로 집계되지 않았을 수 있습니다. 그렇기 때문에 저희는 제공된 데이터를 데이터 정리와 차트를 그리는 기술을 연마하는 데에만 사용하시길 권합니다. 참가자들은 스스로 어떤 미묘한 요인 (nuancing factors) 가 이러한 관계 아래에 깔려있는지 생각해야 합니다.

Tidy Tuesday 의 의도는 결론을 도출하는 것과는 무관하게 개인들이 스스로 데이터 전처리와 시각화 연습을 할 수 있도록 안전하고 서로 지원해주는 장을 만들기 위함입니다. 이 둘이 관련이 있다는 것을 저희도 이해하고 있으나, 이 연습의 목적은 순수하게 실제 데이터를 가지고 연습하는 것입니다.

모든 데이터는 월요일에 data sets 페이지에 올라갈 것입니다. 데이터와 함께 문맥을 파악할 수 있도록 원문도 같이 포함할 예정입니다.

저희는 모든 초심자, 열정이 있는 사람, 그리고 전문가가 참여하도록 환영합니다. 하지만 몇 가지 명심해주셨으면 하는 게 있습니다.

데이터셋은 원문 또는 원문이 인용한 출처에서 가져왔습니다. 데이터는 있는 그대로 받아들이시고, Tidy Tuesday 는 여러분이 R 을 이용해서 기본적인 데이터 전처리와 시각화를 연습하는 것을 돕기 위해 만들어졌다는 걸 기억해주세요.
다시 한 번 말씀 드립니다. 데이터는 그게 다입니다! 여러분이 제공된 데이터 이외에 더 탐색하는 것을 환영합니다만, 이 데이터는 연습을 위해 제공된 “장난감 (toy)” 데이터입니다.
이 프로젝트는 남을 비평하는 것도, 동료 #RStats 사용자와 그의 코드를 뜯어보는 게 목적이 아닙니다! 서로를 지지하고 친절하게 대하세요! 다른 사람의 글에 좋아요도 눌러주시고, #RStats 커뮤니티를 널리 알리는 것을 도와주세요!
여러분이 스스로 코드를 짰고 이를 공유할 때에는 트위터에서 #TidyTuesday 해시태그를 꼭 붙여주세요.
트위터에 글을 쓸 때에는 시각화한 것의 사진을 같이 올려주세요.
트위터에 글을 쓸 때에는 시각화에 사용한 코드도 같이 올려주세요. 본인과 다른 사람이 자신의 프로세스를 이해하는 것을 도울 수 있도록 가능하다면 코드에 주석을 달아주세요.
비록 쉬운 것으로 끝냈더라도 여러분의 작업물을 개선하는 것에 집중해주세요!
가능하다면 원본 데이터의 출처에 감사를 표해주세요.

데이터셋 제출하기

흥미로운 데이터셋을 제공하고 싶으신가요? 이슈 를 열어서 데이터를 사용한 글 (또는 블로그 글 등) 의 링크를 달아주세요. 그런 뒤에 향후의 TidyTuesday 행사에 이 데이터를 추가할 지 이야기 해보시죠!

코드 제출하기

유용한 코드를 제출하고 싶다고요? 풀 리퀘스트 (Pull Request) 형태로 제출해주시고 가이드 를 꼭 지켜주세요.

2025 9
2023 5
2022 1
2020 7
2019 24

2025

실험 기간을 좀 더 늘리면 안 돼요?

4 minute read

실험을 한 번 진행했는데 통계적으로 유의하지 못한 결과를 얻었습니다. 기간을 조금 더 두고 실험을 하자니 시간이 오래 걸릴 것 같은데 기존 결과를 그대로 포함해서 실험 기간을 늘려서 보면 안 되나요?

A/B 테스트가 통계학을 망치고 있다

2 minute read

A/B 테스트란 무엇이고, 제가 왜 이게 통계학을 망치고 있다고 생각하는지 설명드리고자 합니다.

(번역) AI 가 우리에게 다가오고 있다

5 minute read

이 글은 AI가 데이터베이스에 직접 접근해 인간 전문가처럼 데이터를 분석하는 새로운 워크플로우를 소개합니다. 단순한 질의응답을 뛰어넘는 이러한 도약은 데이터 분석가의 역할이 근본적으로 재정의될 미래를 암시합니다.

(번역) 넷플릭스 게임 사용자의 모험

2 minute read

이 글은 넷플릭스 (Netflix) 에서의 분석 엔지니어링 (Analytics Engineering) 관련 업무의 범위를 공유하기 위한 여러 편의 글 중 두 번째 글이며, 최근에 열렸던 분석 엔지니어링 컨퍼런스에서 발표된 내용이기도 합니다. 더 많은 내용이 궁금하신가요? 첫 번째 ...

(번역) 듀오링고의 그로스 모델에 대한 오해

4 minute read

(번역) 듀오링고가 사용자의 성장에 다시금 불을 지핀 방법 - Part 3

10 minute read

듀오링고의 350% 성장의 뒷 이야기, 리더보드, 연속 학습, 알림, 그리고 혁신적인 그로스 모델 들어가기에 앞서

(번역) 듀오링고가 사용자의 성장에 다시금 불을 지핀 방법 - Part 2

7 minute read

듀오링고의 350% 성장의 뒷 이야기, 리더보드, 연속 학습, 알림, 그리고 혁신적인 그로스 모델 들어가기에 앞서

(번역) 듀오링고가 사용자의 성장에 다시금 불을 지핀 방법 - Part 1

8 minute read

듀오링고의 350% 성장의 뒷 이야기, 리더보드, 연속 학습, 알림, 그리고 혁신적인 그로스 모델

(번역) 의미있는 지표 (데이터로 제품팀이 집중해야할 것을 뾰족하게 만든 방법)

11 minute read

원문: Meaningful metrics: How data sharpened the focus of product teams

2023

(번역) Booking.com 에서의 축차 검정 (Sequential Testing)

19 minute read

원문: Sequential Testing at Booking.com

영어랑 친해지는 방법

7 minute read

가장 좋은 방법은 당연히 영어 밖에 사용하지 못하는 환경에 강제로 처해지는 것이겠지만 그것이 어려우니…

신입 데이터 분석가를 꿈꾸는 분들에게

3 minute read

고민의 흔적을 보여주세요

데이터 트래킹 기깔나게 잘 하는 방법

4 minute read

을 찾습니다.

(번역) Testing Product Ideas Handbook

6 minute read

소개

2022

(번역) 차트와 접근성

4 minute read

원문: Charts & Accessibility

2020

모수, 큰 수의 법칙, 그리고 중심극한정리

3 minute read

모수, 큰 수의 법칙, 그리고 중심극한정리에 대하여

(번역) 내가 COVID-19 데이터를 시각화하지 않는 이유

12 minute read

그리고 여러분들도 (아마도) 하지 않아야 하는 이유

사내 스터디에 대한 회고

2 minute read

회사 서비스의 추천 시스템을 개선하기 위해 팀 내에서 (아직까진 두 명이긴 하지만) 지난 두 달 동안 스터디를 진행했습니다. 얼마 전 두 번째 스터디가 끝났고 이에 대한 회고를 해보려고 합니다.

(번역) 데이터의 어두운 면 - 개인정보 (Dark Side of Data:Privacy)

6 minute read

원문: Dark Side of Data: Privacy by Emre Rencberoglu

(번역) 초보자를 위한 RStudio 의 프로젝트 와 작업 디렉토리

9 minute read

원문: RStudio Projects and Working Directories: A Beginner’s Guide by Martin Chan