데이터 미생, 데그래의 일기
🧐데차장: 데그래씨, 데이터 시각화가 좀 필요한데. 판다스 할 줄 알지?
😲데그래: 판다요..? 회사에서 판다를 왜 찾으세요..?
🧐데차장: 지금 농담할 시간 없어. 급한 거니까 이번 주까지 할 수 있지?
판다스는 판다랑 아무 관계없어요
회사에서 판다를 왜 찾냐고요?
데차장님이 말씀하신 판다스는 데이터 분석 도구랍니다.
판다랑은 전혀 상관이 없어요🐼
그럼 이제부터 '판다스'를 한 입에 떠먹여드릴게요, 와삭바삭!
데이터 시각화에 특화된 분석도구, 판다스
엑셀, R, 파이썬, SQL 등 데이터 분석을 할 수 있는 도구는 참 다양해요.
그중에서도 판다스는 데이터 시각화에 특화된 도구랍니다.
수식으로 데이터를 계산할 수도 있고, 데이터를 다양한 방법으로 시각화할 수도 있어요.
'새로 배우기 귀찮은데, 그냥 익숙한 엑셀을 쓰면 안 되나?' 궁금하실 수도 있는데요.
판다스를 쓰는 가장 큰 이유는 엑셀에서 다루기 힘든 대용량 데이터를 분석할 수 있기 때문입니다.
또한, 판다스는 널리 쓰이는 데이터 분석 도구인 '파이썬'을 기반으로 동작한답니다.
'파이썬'으로 데이터 분석을 입문한 분들은 필수적으로 판다스를 사용해요.
시리즈와 데이터프레임
판다스를 공부하다 보면 '시리즈'와 '데이터프레임'을 마주치게 되는데요.
시리즈(Series)란 칼럼 이름과 인덱스, 값으로 이루어진 1개의 열을 뜻합니다.
시리즈가 다수 모여 형성하는 테이블 형태의 데이터를 데이터프레임(DataFrame)이라고 불러요.
이는 R에서 사용되던 data.frame 구조를 본뜬 것으로, R에서 쓰던 대부분의 기능을 쓸 수 있다는 장점도 있어요.
판다스 공부하는 법
이렇게 쓸모가 많은 판다스를 공부하고 싶어 졌다면?
판다스 10분완성(10 minutes to pandas)가 길잡이가 돼 줄 거예요.
쓱읽는 데는 10분이면 되지만, 문서를 따라 코드를 직접 쳐보는 데는 더 많은 시간을 필요로 한답니다.
하지만 걱정 마세요! 실습을 도와주는 유튜브 영상이나 인터넷 강의도 많이 있으니까요.
데잇걸즈 2기 선배님들이 함께 진행한 10 Minutes to Pandas 한글 번역 자료도 있답니다.
또, 판다스 Cheat Sheet란 문서도 있어요.
Cheat Sheet은 커닝 페이퍼와 유사한 컨셉으로, 짧은 문서 안에 핵심 기능을 쏙쏙 넣어놓은 문서입니다.
판다스 Cheat Sheet에는 판다스에서 자주 쓰는 핵심 기능들이 잘 정리되어있겠죠?
데그래처럼 여러분도 판다스 공부 시작해보는 건 어떨까요:)
글을 마치며...
😲데그래: 차장님, 판다스 사용해서 시각화 완료해놓았습니다. 며칠 야근해서 완료했어요!
😉데차장: 어? 그거 다음주로 밀렸다고 말 안 했나? 아무튼 고생했다~
😫데그래: (%&#!@*&$%)
오늘도 인성을 내주고 분석 능력을 얻은 데그래였습니다...
SQL? 누구냐 너!! (1) | 2020.11.11 |
---|---|
AARRR? 이거 오타 아닌가요? (1) | 2020.10.28 |
주석? 저는 추석연휴 보내고 왔는데요.. (0) | 2020.10.10 |
커밋? 제가 아는 커밋은 개구리인데요? (1) | 2020.09.23 |
댓글 영역