본문 바로가기
728x90

Computer Science319

[AI/ML Examples] MLE with data from exponential distribution MLE with data from exponential distribution 포스트 난이도: HOO_Senior # Example LetX1, . . . , X100be independent rvs from the exponential distribution with rateλ(i.e., rate is thereciprocal of the population mean here). Nature uses the following code to generate the data: set.seed(0); x = rexp(100,10); I.e., in the game theory setup, Nature chosesλ= 10, but this is not known to the Statistician. # Ex.. 2023. 2. 6.
[SML] Critical Thinkings of The Linear Regression Critical Thinkings of The Linear Regression 포스트 난이도: HOO_Senior # Linear regression에서 고려해야 하는 것들 Linear regression에서 얻은 결과를 분석하는데 있어서 기본적으로 고려해야 될 것들이 있다. 마치 기본적으로 산출된 결과를 분석하는데 알아두어야 될 지침서와 비슷하다. 아래의 예시를 활용하면 산출된 결과를 분석하는데 매우 용이하다. Is there a relationship between X1 and Y? How strong is the relationship between X2 and Y? Which X contribute to Y? How accurately can we predict future Y? is the re.. 2023. 1. 30.
[Statistical Machine Learning] Linear regression, Estimation of the parameters, residual, RSS Linear regression, Estimation of the parameters, residual, RSS 포스트 난이도: HOO_Senior # Linear regression(선형 회귀) 선형 회귀로 알려져 있는 Linear regression는 모델링 분석에서 상당히 많이 사용되는 방식이다. "회귀"에서 알 수 있듯이 Linear regression은 Dependence of Y(종속 변수 Y)와 다수의 선형 X값들을 추정해서 상관관계를 산출해 낸다. 여기서 선형 X값들을 독립적 변수 X라고도 부른다. https://whoishoo.tistory.com/568 [Statistical Machine Learning] Parametric models: Linear model Parametric m.. 2023. 1. 28.
[Statistical Machine Learning] Parametric models: Linear model Parametric models: Linear model 포스트 난이도: HOO_Senior # Parametric models: Linear model Parametric models(매개변수 모델)에서 Linear model(선형 모델)은 대표적이면서도 중요한 모델에 해당된다. 매개변수 모델을 배우는 데 있어서 가장 우선적으로 배우는 모델임에 동시에 비교 분석에서 가장 많이 사용되는 모델이기도 하다. 선형 모델을 식으로 표현하면 아래와 같이 표현이 가능하다. 여기서 베타가 의미하는 바가 바로 매개변수이다. 매개변수라고 해서 어색할 수는 있지만 파라미터(Parameters)를 의미한다. 파라미터는 p+1로 선형 모델에 나타내지며, 우리는 파라미터를 예측할 수가 있다. 파라미터를 예측하기 위해서는 주어진.. 2023. 1. 27.
[Statistical Machine Learning] Estimate f(x): neighborhood, nearest neighbor averaging, curse of dimensionality Estimate f(x): neighborhood, nearest neighbor averaging, curse of dimensionality 포스트 난이도: HOO_Senior # Estimate f Statistical machine learning(SML)에서 f(function)는 데이터를 분석하는 데 있어서 중요하다. f를 어떻게 설정하느냐에 따라서 결과가 완전히 달라질 수 있기 때문이다. 그렇다 보니 f를 어떻게 설정하는지가 데이터 분석에 있어서 중요한 요소이고 데이터 분석가 또는 데이터사이언티스트의 능력을 보여준다. 하지만 아무리 능력이 좋은 데이터사이언티스트라고 할지라도 데이터를 보자마자 f를 만들어낼 수는 없다. f를 구성하는 데 있어서도 데이터를 기반으로 해서 알아내야 한다. SML에.. 2023. 1. 25.
[Statistical Machine Learning] Regression Function: f(x), irreducible error, reducible error, Bias, Variance Regression Function: f(x), irreducible error, reducible error, Bias, Variance 포스트 난이도: HOO_Senior # Irreducible Error 이전 포스트에서 Regression function과 Mean-squared prediction error(MSE)에 대해서 알아보았다. https://whoishoo.tistory.com/565 [Statistical Machine Learning] Regression Function: f(x), expected value, Mean-squared Prediction Error Regression Function: f(x), expected value, Mean-squared Prediction.. 2023. 1. 25.
[Statistical Machine Learning] Regression Function: f(x), expected value, Mean-squared Prediction Error Regression Function: f(x), expected value, Mean-squared Prediction Error 포스트 난이도: HOO_Senior # Ideal f(x) 저번 포스트에서 Statistical machine learning(SML)에 대해 무엇이며, 어떤 기본 공식을 가지고 있는지 알아보았다. https://whoishoo.tistory.com/562 [Statistical Machine Learning] Introduce Statistical Learning Introduce Statistical Learning 포스트 난이도: HOO_Senior # Statistical Learning 위의 예제는 Statistical learning에서 사용하는 기본적인 수식이다... 2023. 1. 25.
[Statistical Machine Learning] Introduce Statistical Learning Introduce Statistical Learning 포스트 난이도: HOO_Senior # Statistical Learning 위의 예제는 Statistical learning에서 사용하는 기본적인 수식이다. 우선 PL이라고 나와있는 Programming Languages라는 변수(Y)는 respons 또는 target에 해당한다. f라고 나와있는 function 안에는 여러 원소들이 포함되어 PL이라는 결과를 산출한다. f 안에 있는 원소(x)들을 input, feature, predictor이라고 부른다. 아래의 다른 예시들도 살펴보면 이해하는데 도움이 될 것이다. 위의 예시를 간단하게 수식을 표현하면 아래와 같다. 위와 같이 수식으로 표현할 수 있으며, function 안의 x로 표현된 원소들.. 2023. 1. 19.
[Blockchain] Digital Commodity (디지털 상품) Digital Commodity (디지털 상품) 포스트 난이도: HOO_Senior # 디지털 상품(Digital Commodities) Digital commodity는 한국말로 디지털 상품이라고 불리며, 가상의 환경에서 제공되는 상품을 의미한다. 디지털 상품(Digital commdoities)은 가상의 공간에서 거래되는 상품들을 의미하며 실질적으로 경제적 가치를 지니고 있는 상품들을 말한다. 예를 들면, 게임이나 노래와 같이 물리적으로 존재하지는 않지만 무형의 가치를 지니고 있으면서 인터넷상에서 거래가 되는 경제적 상품들이 디지털 상품에 해당한다. 최근에는 기존에 디지털 상품이라고 부르던 것 외에도 다양한 디지털 상품들이 생겨나기 시작했다. 대표적인 예가 바로 가상 화폐이다. 가상 화폐 또한 디지털.. 2023. 1. 15.
[Data Science] 한글 csv 파일 cp949 인코딩으로 pd.read_csv() 하는 방법 한글 csv 파일 cp949 인코딩으로 pd.read_csv() 하는 방법 포스트 난이도: HOO_Middle # 한글 csv 파일 cp949 인코딩으로 pd.read_csv() 예제 코드 한글이 포함된 csv 파일인 경우에는 Pandas에서 데이터를 읽고 처리하는데 utf-8 에러가 발생할 수 있다. 영어로 되어 있다면 문제가 없겠지만 한글이나 한국에서 주로 사용하는 특수 기호가 포함되어 있다면 이러한 에러 문제가 발생한다. 한마디로 컴퓨터에게 한글을 사용할 것이라는 걸 알려줘야 하는데, 이때 인코딩 세팅을 추가로 해주면 문제없이 데이터 읽고 사용이 가능하다. 인코딩 넘버는 'cp949'이며 pd.read_csv()에 인코딩을 추가해줘서 쉽게 한글 csv 파일 사용이 가능하다. import pandas.. 2022. 12. 31.
[Data Science] Colab에서 출력한 Data Table를 Data Frame에 맞추어 정렬하는 방법, 데이터 프레임 전환하는 방법 Colab에서 출력한 Data Table를 Data Frame에 맞추어 정렬하는 방법, 데이터 프레임 전환하는 방법 포스트 난이도: HOO_Junior # Colab Data Table 코랩(Colab)에서 csv 파일 내의 데이터를 보기 위해서 특정 데이터 테이블을 출력할 경우 보기 안 좋게 망가져서 출력이 되는 경우가 있다. 왜냐하면 csv 데이터 파일 자체가 데이터 분석을 하기 위해서 데이터가 처음부터 정리되어 저장이 되어 있지 않거나 출력하려는 데이터 형태와의 차이가 있으면 이러한 경우가 종종 발생한다. 데이터를 분석하는데 있어서 코드 자체에 문제를 주지 않지만 출력된 데이터 테이블을 분석하는데 어려움이 있다. 한마디로 데이터에 대한 가독성이 떨어져서 작업이 시간이 소요된다는 것이다. 이러한 경우.. 2022. 12. 31.
[Data Science] IOPub data rate exceeded 에러 IOPub data rate exceeded 에러 포스트 난이도: HOO_Middle # IOPub data rate exceeded 데이터를 읽는 데 있어서 pd.read.csv()를 했을 때, IOPub data rate exceeded라는 에러가 발생할 수 있다. 특히 클라우드 서버(Cloud server) 기반으로 코딩을 할 경우에 이러한 에러가 발생할 가능성이 높다. IOPub data rate exceeded. The notebook server will temporarily stop sending output to the client in order to avoid crashing it. To change this limit, set the config variable `--NotebookA.. 2022. 12. 30.
[Data Science] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 740: invalid start byte UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 740: invalid start byte 포스트 난이도: HOO_Middle # UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 740: invalid start byte 이 문제가 발생하는 이유는 한글이 포함된 데이터에서 인코딩 형식 에러로 발생한다. 한글 인코딩 에러와 관련된 자세한 내용은 아래의 포스트를 참고하면 된다. https://whoishoo.tistory.com/409 [Data Science] Pandas csv 유니코드 디코드 에러 문제 해결 방법 Pandas csv 유니코드 디코드 에러 .. 2022. 12. 30.
[Blockchain] 파이썬 기반 블록체인 라이브러리: datetime, hashlib, JSON 파이썬 기반 블록체인 라이브러리: datetime, hashlib, JSON 포스트 난이도: HOO_Senior # import library 파이썬 기반으로 블록체인 모델을 만들 때 기본적으로 사용되는 라이브러리는 아래와 같다. import datetime import hashlib import JSON # Blockchain libraries import datetime import hashlib import JSON 우선 datetime의 경우에는 타임스탬프(Timestamp) 역할을 담당하여 블록체인 모델에 있어서 시간 기록을 할 수 있는 기능을 제공한다. 예를 들어 새로운 블록 또는 노드가 생성된다고 했을 때, 해당 시간에 대한 기록이 필요하다. 이때 datetime 라이브러리에서 제공하는 no.. 2022. 12. 29.
[Data Science] Exploratory Data Analysis (탐색적 데이터 분석)이란? Exploratory Data Analysis (탐색적 데이터 분석)이란? 포스트 난이도: HOO_Senior # Exploratory Data Analysis 머신러닝을 통해서 데이터 분석 작업을 해본 개발자라면 EDA에 대해서 들어봤을 것이다. EDA는 Exploratory Data Analysis의 줄임말로 탐색적 데이터 분석이라고도 부른다. 말 그대로 데이터를 분석하기 전에 전반적인 데이터에 대해 알아보는 과정 자체를 EDA라고 부른다. 데이터 사이언스 프로젝트를 많이 해본 개발자에게는 EDA를 하라고 한다면 잠을 자고 있는 와중에도 뚝딱뚝딱할 수가 있다. 이 말인즉슨, EDA를 하는 과정 자체는 대부분의 데이터 사이언스 프로젝트에서 비슷하기 때문이다. 데이터를 분석하는 과정에서 데이터 정보를 나.. 2022. 12. 16.
[Data Science] 데이터 사이언스를 처음 공부할 때: 사이킷런(sklearn) 데이터 사이언스를 처음 공부할 때: 사이킷런(sklearn) 포스트 난이도: HOO_Middle # scikit-learn 사이킷런(scikit-learn)이라고 부르는 sklearn 라이브러리는 구조 데이터를 분석하는 데 사용되는 대표적인 머신러닝 라이브러리이다. 그렇기에 많은 개발자들이 사이킷런을 알고 있으며, 데이터 사이언스 분야가 아니더라도 머신러닝을 사용하는 개발자라면 사이킷런을 처음 접하고 공부했을 가능성이 높다. 머신러닝을 공부하는 데 있어서 사이킷런 라이브러리를 사용하는 이유는 머신러닝을 이해하는데 아주 심플하면서도 데이터 사용과 관리가 어떤 식으로 이루어지는지 쉽게 이해할 수 있기 때문이다. sklearn은 주로 구조화 데이터 분석을 하는데 사용이 되기 때문에 데이터를 다루는 데 있어서 .. 2022. 12. 16.
[Android App] 파이어베이스(Firebase) 실시간 데이터베이스 삭제하는 방법 파이어베이스(Firebase) 실시간 데이터베이스 삭제하는 방법 포스트 난이도: HOO_Middle # Real-time Cloud Database 앱 개발을 하고 나서 해당 프로젝트가 중지되었거나 더 이상 개발된 앱을 사용하지 않는다고 했을 때 Database도 정리를 해주어야 한다. 특히 Cloud database인 경우에는 또 다른 유저가 지속적으로 접근이 가능하기 때문에 접근을 제한하거나 서버 자체를 제거해줘야 한다. Cloud real-time database 인 파이어베이스(Firebase)인 경우에도 더이성 서버 사용을 하지 않는다면 삭제해주는 것이 좋다. 특히 파이어베이스와 같이 오픈 클라우드 데이터베이스인 경우에는 다른 유저가 지속적으로 접근이 가능하기 때문에 데이터베이스를 삭제해주는 것.. 2022. 12. 14.
[Blockchain] Private Blockchain이란? Private Blockchain이란? 포스트 난이도: HOO_Senior # Private blockchain 블록체인에는 접근성을 기준으로 3가지 유형으로 분류하여 나타낸다. 첫 번째가 Private blockchain이고 그 뒤로 Permission blockchain, Public blockchain 등이 있다. 이번 포스트에서는 Private blockchain에 대해서 살펴보도록 하자. Private blockchain 또는 한국말로 폐쇄형 블록체인은 블록체인 기술을 제한적인 상황에서 활용한 경우를 의미한다. 앞서 이야기한 대로 접근성을 기준으로 유형을 분류하여 부르기 때문에 폐쇄형 블록체인은 다른 블록체인 유형에 비해서 접근성이 매우 제한적이다. 폐쇄형 블록체인은 블록체인 기술을 사용하고 있.. 2022. 12. 12.
[Blockchain] 블록체인은 데이터베이스가 필요 없나요? 블록체인은 데이터베이스가 필요 없나요? 포스트 난이도: HOO_Middle # 블록체인도 기록이 필요하다. 블록체인을 생각하면 "Decentralized network 또는 Decentralized database이기 때문에 데이터베이스가 필요할까?"라는 의문을 가질 수 있다. 거두절미하고 블록체인도 데이터를 저장할 공간이 필요한 건 사실이다. 데이터라는 것이 눈에 보이지 않는 무형의 가치를 가진 것이지만 이를 기록하기 위한 특정한 공간이 필요하다. 블록체인을 활용한다 할지라도 어딘가에는 기록을 해야 한다는 것이다. 예를 들어, 직장인이 다른 거래처와의 미팅 약속을 잡았다고 가정해보자. 직장인은 미팅 약속에 대한 정보를 스케줄러나 메모장에 기입하기도 하지만 별도의 기록 없이 머리로 기억할 수도 있다. 이.. 2022. 12. 11.
[Python] KeyError: 0 (sklearn predict function error) 해결 방법 KeyError: 0 (sklearn predict function error) 해결 방법 포스트 난이도: HOO_Junior # KeyError: 0 (sklearn predict function error) sklearn은 Scikit-learn의 줄임말로써 대표적인 머신러닝 라이브러리 중에 하나이다. 머신러닝의 기초를 배우고 구조 데이터를 처리한다고 할 때 사용하는 라이브러리 중 하나가 바로 sklearn인 셈이다. sklearn에서 predcit function을 사용하려고 했을때 KeyError:0라는 에러가 발생하는 경우가 있다. KeyError:0의 원인은 작성된 코드에 따라 원인이 다양하다. 하지만 일반적으로 KeyError:0가 발생할 경우 defaultdict() 함수를 통해서 이 문제.. 2022. 12. 5.
[Data Science] 피어슨 상관관계(Pearson Correlation) 피어슨 상관관계(Pearson Correlation) 포스트 난이도: HOO_Junior # 피어슨 상관관계(Pearson Correlation) 피어슨 상관관계는 두 변수에 관계를 선형 데이터로 나타낸 방식을 의미한다. 데이터 사이언스에서 상관관계는 기본적으로 알고 있어야 하며, 피어슨 상관관계는 데이터를 다루는 데 있어서 가장 기본적으로 배우는 이론이다. 피어슨 상관 (계수) 관계는 Covariance(공분산)과 Standard deviation(표준 편차)을 사용하여 나타낼 수 있다. 여기서 비교되는 값은 두 개의 연속적인 변수를 의미한다. 한마디로 두 개의 서로 다른 연속성을 가진 데이터를 비교 분석을 피어슨 상관관계를 통해서 한다는 것이다. # 피어슨 상관관계에서 무조건 선형이 아닐 수도 있다... 2022. 11. 19.
[Data Science] 데이터 사이언스를 하고 싶으면 무슨 언어를 공부해야 할까요? 데이터 사이언스를 하고 싶으면 무슨 언어를 공부해야 할까요? 포스트 난이도: HOO_Junior # 데이터 사이언스와 프로그래밍 언어 데이터 사이언스(Data science) 분야에는 크게 3가지의 직업으로 나뉜다. 데이터 분석가, 데이터 엔지니어 그리고 데이터 사이언티스트이다. 일반적으로 데이터 사이언티스트가 데이터 분석가와 데이터 엔지니어를 포괄하고 데이터 엔지니어가 데이터 분석가를 포괄하는 직업으로 알고 있다. 구체적으로 살펴보면 각 직업마다 데이터를 다루고 담당하는 분야나 방식이 조금씩 다르지만 완전히 틀린 말은 아니라고 본다. 사실상 데이터 엔지니어는 데이터 분석가가 하는 업무를 할 줄 알아야 하고 데이터 사이언티스트는 데이터 엔지니어와 데이터 분석가가 하는 업무를 모두 할 수 있어야 하기 때문.. 2022. 11. 18.
[Data Science] 데이터 사이언스란? 데이터 사이언스란? 포스트 난이도: HOO_Junior # Data science 데이터 사이언스(Data science)는 데이터를 기반으로 하여 결과를 도출해내거나 산출된 결괏값을 기반으로 미래의 대한 결과를 사전에 예측하는 것을 의미한다. 한마디로 데이터 분석을 통해서 현재의 결과를 도출해낼 뿐만 아니라 최종적으로 앞으로의 미래를 예측하는 역할도 수행하기에 우리는 데이터 사이언스 또는 한국말로는 데이터 과학이라고 부른다. 데이터 사이언스는 머신러닝을 통해서 정보(Information)을 산출해내고 이러한 정보는 사용자에게 전달하거나 또 다른 인공지능 프로그램의 학습 소재로 사용이 되어 인공지능 프로그램의 최적화를 만들어주기도 한다. 따라서 우리는 인간을 위한 데이터 사이언스와 기계를 위한 데이터 사.. 2022. 11. 16.
[Data Science] Empirically Detecting Causality: Convergent Cross Mapping Empirically Detecting Causality: Convergent Cross Mapping 포스트 난이도: HOO_Senior # Empirically Detecting Causality 현실 세계에서 일어나거나 발생하는 모든 데이터는 사실상 Time series로 존재한다. 왜냐하면 살고 있는 세상 자체가 시간을 기준으로 움직이다 보니 외부적인 요인에 대한 수치화 또는 표준화 과정은 Times series data를 통해서 산출되는 것이다. 문제는 Real world에서 우리는 Time series data를 바로 얻어낼 수 없다. 따라서 Dynamic data를 Time series로 record 하여 single variable를 산출한다. 또한 Time series data를 바로 사.. 2022. 11. 14.
[Blockchain] 하이퍼레저 패브릭 블록체인이란? (Hyperledger Fabric Blockchain Model) 하이퍼레저 패브릭 블록체인 모델(Hyperledger Fabric Blockchain Model) 포스트 난이도: HOO_Senior # Hyperledger Fabric Hyperledger Fabric은 리눅스 파운데이션(Linux Foundation)에서 2015년 발표한 오픈소스 기반 범용적 블록체인 프로젝트 중의 한 프레임워크 모델에 해당한다. 당시에는 Blockchain 기반으로 한 비즈니스 거래에 활용할 수 있는 시스템 모델을 만드는 것이 프로젝트의 주요한 목표였으며 이를 하이퍼레저 또는 Hyperledger project라고 불렀다. 거기서 첫번째 대중적으로 사용할 수 있는 모델로 나온 것이 바로 Hyperledger Fabric이다. 이후에 블록체인 세미나에서 IBM이 소개하는 Hyper.. 2022. 11. 1.
[Blockchain] 블록체인 합의 알고리즘(Blockchain Consensus Algorithms) 블록체인 합의 알고리즘(Blockchain Consensus Algorithms) 포스트 난이도: HOO_Senior # Consensus Algorithms Consensus algorithms이라고 불리는 합의 알고리즘은 노드 간의 합의를 통해서 알고리즘의 결과를 산출해낸다. 기존의 Centralized network 방식에서 Decentralized network 방식을 채택하고 있는 블록체인의 경우는 Consensus algorithm을 사용하는 대표적인 경우이다. 물론 블록체인이 무조건 탈중앙화 방식을 채택하지는 않지만 그럼에도 합의 알고리즘 방식을 채택하는 대표적인 경우가 블록체인임에는 틀림없다. 합의 알고리즘이라고 하면 과반수 이상의 노드가 충족되어야만 Ture가 성립되는 걸 의미한다. 하지.. 2022. 10. 12.
[R / RStudio] Error in file(file, ifelse(append, "a", "w")) : cannot open the connection Error in file(file, ifelse(append, "a", "w")) : cannot open the connection 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Error in file(file, ifelse(append, "a", "w")) : cannot open the connection RStudio에서 작성한 코드를 실행해서 Plot을 출력하고자 할 때에는 발생하지 않는 문제이지만 산출된 값을 저장하려고 할 .. 2022. 9. 22.
[R / RStudio] Error in setw() 해결 방법 Error in setw() 해결 방법 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Error in setw() Error in setwd(dir.results.resample_data) : object 'dir.results.resample_data' not found 위의 경우처럼 in setwd()에서 에러가 발생할 수 있다. R에서 setwd는 가공되거나 시각화된 데이터 수치를 저장하는 데 사용하는 기능이다. 저장할 파일의 위치.. 2022. 9. 19.
[Data Science] Time Series Data Times Series Data 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Data, Information, Knowledge 데이터는 정보가 아니고 지식이 아닐 수도 있다. 마찬가지로 정보는 지식이 아닐 수 있다. 이 말인즉슨 데이터라고 해서 바로 정보나 지식이 되는 것이 아니며 정보라고 해서 바로 지식이 되는 것이 아니다. 데이터 분석, 엔지니어, 사이언티스트는 이러한 데이터들을 다루고 정보와 지식으로 바꿔주는 역할을 수행하게 된.. 2022. 8. 28.
[Data Science] 캐글 타이타닉(Titanic Machine Learning Competition) #02 캐글 타이타닉(Titanic Machine Learning Competition) #02 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # 프로젝트에서 요구하는 내용을 파악한다 프로젝트에서 제공하는 데이터들의 파악이 끝났다면 해당 데이터를 기반으로 요구하는 내용을 파악하여 코드를 작성하는 것이 중요하다. 데이터 사이언스는 다양한 데이터를 활용해야 하기 때문에 코드 작성에 앞서서 프로젝트를 어떤 식으로 기획해서 목표를 이룰 것인지가 중요하다... 2022. 7. 31.
728x90