본문 바로가기
728x90

pandas4

[Data Science] Exploratory Data Analysis (탐색적 데이터 분석)이란? Exploratory Data Analysis (탐색적 데이터 분석)이란? 포스트 난이도: HOO_Senior # Exploratory Data Analysis 머신러닝을 통해서 데이터 분석 작업을 해본 개발자라면 EDA에 대해서 들어봤을 것이다. EDA는 Exploratory Data Analysis의 줄임말로 탐색적 데이터 분석이라고도 부른다. 말 그대로 데이터를 분석하기 전에 전반적인 데이터에 대해 알아보는 과정 자체를 EDA라고 부른다. 데이터 사이언스 프로젝트를 많이 해본 개발자에게는 EDA를 하라고 한다면 잠을 자고 있는 와중에도 뚝딱뚝딱할 수가 있다. 이 말인즉슨, EDA를 하는 과정 자체는 대부분의 데이터 사이언스 프로젝트에서 비슷하기 때문이다. 데이터를 분석하는 과정에서 데이터 정보를 나.. 2022. 12. 16.
[Python Examples] pd.DataFrame(): Section별 학생 구분하여 출력하기 pd.DataFrame(): Section별 학생 구분하여 출력하기 포스트 난이도: HOO_Intern # Example Codes import pandas as pd df = pd.DataFrame({"section": [3,1,1,2,2,3], "students": ['James', 'Julia', 'Megan', 'Henry', 'Minji', 'Yelin']}) sec_1 = df[df['section'] == 1] sec_2 = df[df['section'] == 2] sec_3 = df[df['section'] == 3] print(sec_1) print(sec_2) print(sec_3) section students 1 1 Julia 2 1 Megan section students 3 2 .. 2022. 10. 28.
[Pandas] head() function head() function 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # head() 데이터 사이언스 프로젝트를 하기 위해서 판다스(Pandas)를 통해서 데이터셋을 불러올 수 있다. .csv 와 같이 텍스트 형식의 테이블 데이터셋을 불러와서 Training dataset으로 사용할 수가 있다. 혼자서 작업을 할 경우에는 각각의 데이터셋이 어떻게 구성되어 있는지를 알지만, 여러 사람들이 작업을 같이 수행하거나 작업을 수행하는 데 있어 .. 2022. 7. 19.
[Python Example Codes] Matplotlib Scatter #02 [Python Example Codes] Matplotlib Scatter #02 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Matplotlib Scatter 저번 Scatter #01 포스트에 이어서 조금 더 몇 가지 기능을 추가한 Scatter 예제 코드를 만들어 보았다. https://whoishoo.tistory.com/201 [Python Example Codes] Matplotlib Scatter #01 MATPLOTLIB.. 2021. 12. 12.
728x90