본문 바로가기
728x90

Computer Science327

[Data Science] 데이터 사이언스를 하고 싶으면 무슨 언어를 공부해야 할까요? 데이터 사이언스를 하고 싶으면 무슨 언어를 공부해야 할까요? 포스트 난이도: HOO_Junior # 데이터 사이언스와 프로그래밍 언어 데이터 사이언스(Data science) 분야에는 크게 3가지의 직업으로 나뉜다. 데이터 분석가, 데이터 엔지니어 그리고 데이터 사이언티스트이다. 일반적으로 데이터 사이언티스트가 데이터 분석가와 데이터 엔지니어를 포괄하고 데이터 엔지니어가 데이터 분석가를 포괄하는 직업으로 알고 있다. 구체적으로 살펴보면 각 직업마다 데이터를 다루고 담당하는 분야나 방식이 조금씩 다르지만 완전히 틀린 말은 아니라고 본다. 사실상 데이터 엔지니어는 데이터 분석가가 하는 업무를 할 줄 알아야 하고 데이터 사이언티스트는 데이터 엔지니어와 데이터 분석가가 하는 업무를 모두 할 수 있어야 하기 때문.. 2022. 11. 18.
[Data Science] 데이터 사이언스란? 데이터 사이언스란? 포스트 난이도: HOO_Junior # Data science 데이터 사이언스(Data science)는 데이터를 기반으로 하여 결과를 도출해내거나 산출된 결괏값을 기반으로 미래의 대한 결과를 사전에 예측하는 것을 의미한다. 한마디로 데이터 분석을 통해서 현재의 결과를 도출해낼 뿐만 아니라 최종적으로 앞으로의 미래를 예측하는 역할도 수행하기에 우리는 데이터 사이언스 또는 한국말로는 데이터 과학이라고 부른다. 데이터 사이언스는 머신러닝을 통해서 정보(Information)을 산출해내고 이러한 정보는 사용자에게 전달하거나 또 다른 인공지능 프로그램의 학습 소재로 사용이 되어 인공지능 프로그램의 최적화를 만들어주기도 한다. 따라서 우리는 인간을 위한 데이터 사이언스와 기계를 위한 데이터 사.. 2022. 11. 16.
[Data Science] Empirically Detecting Causality: Convergent Cross Mapping Empirically Detecting Causality: Convergent Cross Mapping 포스트 난이도: HOO_Senior # Empirically Detecting Causality 현실 세계에서 일어나거나 발생하는 모든 데이터는 사실상 Time series로 존재한다. 왜냐하면 살고 있는 세상 자체가 시간을 기준으로 움직이다 보니 외부적인 요인에 대한 수치화 또는 표준화 과정은 Times series data를 통해서 산출되는 것이다. 문제는 Real world에서 우리는 Time series data를 바로 얻어낼 수 없다. 따라서 Dynamic data를 Time series로 record 하여 single variable를 산출한다. 또한 Time series data를 바로 사.. 2022. 11. 14.
[Blockchain] 하이퍼레저 패브릭 블록체인이란? (Hyperledger Fabric Blockchain Model) 하이퍼레저 패브릭 블록체인 모델(Hyperledger Fabric Blockchain Model) 포스트 난이도: HOO_Senior # Hyperledger Fabric Hyperledger Fabric은 리눅스 파운데이션(Linux Foundation)에서 2015년 발표한 오픈소스 기반 범용적 블록체인 프로젝트 중의 한 프레임워크 모델에 해당한다. 당시에는 Blockchain 기반으로 한 비즈니스 거래에 활용할 수 있는 시스템 모델을 만드는 것이 프로젝트의 주요한 목표였으며 이를 하이퍼레저 또는 Hyperledger project라고 불렀다. 거기서 첫번째 대중적으로 사용할 수 있는 모델로 나온 것이 바로 Hyperledger Fabric이다. 이후에 블록체인 세미나에서 IBM이 소개하는 Hyper.. 2022. 11. 1.
[Blockchain] 블록체인 합의 알고리즘(Blockchain Consensus Algorithms) 블록체인 합의 알고리즘(Blockchain Consensus Algorithms) 포스트 난이도: HOO_Senior # Consensus Algorithms Consensus algorithms이라고 불리는 합의 알고리즘은 노드 간의 합의를 통해서 알고리즘의 결과를 산출해낸다. 기존의 Centralized network 방식에서 Decentralized network 방식을 채택하고 있는 블록체인의 경우는 Consensus algorithm을 사용하는 대표적인 경우이다. 물론 블록체인이 무조건 탈중앙화 방식을 채택하지는 않지만 그럼에도 합의 알고리즘 방식을 채택하는 대표적인 경우가 블록체인임에는 틀림없다. 합의 알고리즘이라고 하면 과반수 이상의 노드가 충족되어야만 Ture가 성립되는 걸 의미한다. 하지.. 2022. 10. 12.
[R / RStudio] Error in file(file, ifelse(append, "a", "w")) : cannot open the connection Error in file(file, ifelse(append, "a", "w")) : cannot open the connection 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Error in file(file, ifelse(append, "a", "w")) : cannot open the connection RStudio에서 작성한 코드를 실행해서 Plot을 출력하고자 할 때에는 발생하지 않는 문제이지만 산출된 값을 저장하려고 할 .. 2022. 9. 22.
[R / RStudio] Error in setw() 해결 방법 Error in setw() 해결 방법 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Error in setw() Error in setwd(dir.results.resample_data) : object 'dir.results.resample_data' not found 위의 경우처럼 in setwd()에서 에러가 발생할 수 있다. R에서 setwd는 가공되거나 시각화된 데이터 수치를 저장하는 데 사용하는 기능이다. 저장할 파일의 위치.. 2022. 9. 19.
[Data Science] Time Series Data Times Series Data 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Data, Information, Knowledge 데이터는 정보가 아니고 지식이 아닐 수도 있다. 마찬가지로 정보는 지식이 아닐 수 있다. 이 말인즉슨 데이터라고 해서 바로 정보나 지식이 되는 것이 아니며 정보라고 해서 바로 지식이 되는 것이 아니다. 데이터 분석, 엔지니어, 사이언티스트는 이러한 데이터들을 다루고 정보와 지식으로 바꿔주는 역할을 수행하게 된.. 2022. 8. 28.
[Data Science] 캐글 타이타닉(Titanic Machine Learning Competition) #02 캐글 타이타닉(Titanic Machine Learning Competition) #02 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # 프로젝트에서 요구하는 내용을 파악한다 프로젝트에서 제공하는 데이터들의 파악이 끝났다면 해당 데이터를 기반으로 요구하는 내용을 파악하여 코드를 작성하는 것이 중요하다. 데이터 사이언스는 다양한 데이터를 활용해야 하기 때문에 코드 작성에 앞서서 프로젝트를 어떤 식으로 기획해서 목표를 이룰 것인지가 중요하다... 2022. 7. 31.
[Data Science] 캐글 타이타닉(Titanic Machine Learning Competition) #01 캐글 타이타닉(Titanic Machine Learning Competition) #01 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com [해당 포스트는 2021.2.9일 자 포스트를 업데이트한 포스트입니다.] # 데이터 사이언스와 캐글 입문에 좋은 타이타닉 프로젝트 타이타닉 프로젝트는 캐글에서 제공하는 학습용 Competition에 해당한다. Competition을 시작하기 앞서서 데이터 사이언스 프로젝트와 캐글에서 프로젝트를 해본 경험이 .. 2022. 7. 31.
[Deep Learning Algorithms] Adam Optimization Algorithm(아담 최적화 알고리즘) Adam Optimization Algorithm(아담 최적화 알고리즘) 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # SGD Algorithm and Optimal Algorithm 딥러닝(Deep learning)을 통해 머신러닝(Machine learning)을 통해서 학습을 할 때 GD(Gradient Descent) 알고리즘을 활용한다. Gradient descent(줄여서 GD) 알고리즘을 사용함으로써 Deep learning.. 2022. 7. 31.
[Machine Learning] Batch Size, Iteration Batch Size, Iteration 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Gradient Descent # Batch Size Data science 프로젝트에서 사용되는 데이터셋은 한 종류가 아니라 여러 종류의 데이터셋을 종합적으로 분석하여 사용한다. 여기서 말하는 하나의 데이터셋은 빅데이터에 해당하는 데이터셋인 경우가 있는데 결국 여러 종류의 빅데이터를 ML(Machine learning)에 사용되는 셈이다. 이 경우, .. 2022. 7. 29.
[Deep Learning Algorithms] SGD(Stochastic Gradient Descent), 확률적 경사 하강법 SGD(Stochastic Gradient Descent), 확률적 경사 하강법 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Gradient Descent와 Stochastic Gradient Descent 딥러닝(Deep learning) 또는 인공 신경망 학습 모델은 실제 뇌의 시냅스 작용을 보고 만든 학습 모델 방식에 해당한다. 딥러닝을 한다는 점에서는 동일하지만 어떤 알고리즘을 사용하느냐에 따라서는 딥러닝의 효율성이 달라진다. .. 2022. 7. 29.
[Machine Learning] Train Test Size Train Test Size 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Train Test Size ML(Machine learning)을 돌리기 위해서 설정해줘야 하는 초기 설정 값들이 있다. 앞선 포스트에서 다룬 Learning rate나 Epoch가 이에 해당하며, Momentum이나 Seed도 해당된다. (Momentum과 Seed는 다음 포스트를 통해서 이야기를 나눠보도록 하자.) 이번 포스트에서 다루는 Test size 또.. 2022. 7. 27.
[Algorithms] Topology, Network Topology Topology, Network Topology 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Topology와 Network Topology 알고리즘 공부를 하다 보면 자주 마주치는 것이 바로 Topology, 한국말로는 위상수학이다. (필자는 위상 수학보다는 토폴로지가 더 와닿는다.) CS에서 배우는 알고리즘 자체가 새롭게 나온 학문이나 지식이 아닌 기존에 있는 지식을 기반으로 만들어진다. 수학적 개념에서 토폴로지는 연속성과 수렴성을.. 2022. 7. 22.
[Data Science] Data Science vs Data Analyst vs Data Engineering Data Science vs Data Analyst vs Data Engineering 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # DS, DA, DE 데이터 기반 인공지능이 대중화되어 사용되고 있는 만큼 데이터를 다룰 줄 아는 인재들을 많은 기업과 기관에서 찾고 있다. 몇 년 전까지만 해도 Data science라는 분야 하나로 통일되어 왔던 데이터를 다루는 직종이 이제는 Data science, Data analyst, Data e.. 2022. 7. 18.
[Machine Learning] Training Dataset vs Testing Dataset Training Dataset vs Testing Dataset 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Dataset Machine learning을 돌리기 위해서는 학습할 데이터가 필요하다. 이러한 데이터들을 모아놓은 하나의 그룹을 우리는 데이터셋(Dataset)이라고 부른다. Machine learning에서 사용되는 데이터셋은 학습하는 데이터의 종류에 따라 이미지가 될 수도 있고 텍스트 파일이 될 수도 있다. Machine .. 2022. 7. 17.
[Machine Learning] Learning Rate(학습률) Learning Rate 포스트 난이도: HOO_Senior # Gradient descent # Learning Rate Learning rate는 한국에서 학습률이라고 불리는 Mahcine learning에서 training 되는 양 또는 단계를 의미한다. Learning rate 또는 학습률은 딥러닝(Deep learning)에 대해서 배울 때 다룬다. 그 이유는 Deep learning neural networks 자체가 학습하는 과정에서 Stochastic gradient descent algorithm을 사용한다. 이때 사용되는 Stochastic gradient descent에서 학습 데이터를 기반으로 학습 모델 에러에 대한 가중치를 업데이트할 때 사용되는 기준점 중 하나가 Learning .. 2022. 7. 15.
[Data Science] Side Project: HuBMAP + HPA Side Project: HuBMAP + HPA 포스트 난이도: HOO_Lead [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # HuBMAP + HPA 기한 Started date: 6/22/2022 Rules Acceptance Deadline: 9/15/2022 Finished date: 9/22/2022 # Project Explanation: Functional tissue units HuBMAP + HPA 프로젝트는 kaggle에서 진행되는 Competitions .. 2022. 7. 15.
[Data Science] 데이터 사이언스 코드 작성 요령: 디렉토리, 파일명 선언하기 데이터 사이언스 코드 작성 요령: 디렉토리, 파일명 선언하기 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # 디렉토리, 파일명 위치 선언 데이터 사이언스(Data science) 프로젝트를 수행하다 보면, 한 가지 데이터셋을 사용하는 것이 아니라 수많은 데이터셋을 사용하는 경우가 종종 있다. 종류가 다른 데이터셋을 사용하지 않더라도 학습할 데이터셋과 결과로 산출할 데이터셋만 해도 최소 2가지 이상의 데이터셋을 코드 내에서 선언하여 사용해야.. 2022. 7. 8.
[Data Science] Pandas csv 유니코드 디코드 에러 문제 해결 방법 Pandas csv 유니코드 디코드 에러 문제 해결 방법 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # pd.read_csv 판다(Pandas)를 통해서 csv 파일을 읽어올 수 있다. 텍스트 형식과 수치 데이터를 다루는 데 있어서 csv 파일 형식으로 데이터셋을 많이 관리하는 편이다. 따라서 데이터 분석과 같은 데이터 사이언스 프로젝트를 수행하는 데 있어서 판다스 또는 판다를 이용한 데이터 읽고 쓰는 과정은 기본적으로 정말 많이 사용하.. 2022. 7. 7.
[Data Science] Excel CSV 파일에서 한글 깨짐 현상 해결 방법: 메모장 활용하기 엑셀 CSV 파일에서 한글 깨짐 현상 해결 방법 | Excel CSV File 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # CSV 파일 한글 깨짐 현상 CSV 파일 기반 데이터를 가지고 프로그래밍을 하다 보면 한글 깨짐 현상이 종종 발생한다. 특히 CSV.txt 파일 자체에서 한글 깨짐 현상이 일어나지 않지만 엑셀로 전환하여 CSV 파일을 열면 가끔씩 한글 깨짐 현상이 발생하는데 간단한 방법으로 문제 해결이 가능하다. # CSV 파일에.. 2022. 7. 7.
[Data Science] 데이터 사이언스 프로젝트 코드 작성 요령 Data Science 프로젝트 코드 작성 요령 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Data science project 데이터 사이언스 관련 프로젝트를 사용할 때 노트를 활용해서 라이트 하게 작업을 수행하기도 한다. 과거에는 로컬 주피터랩과 같은 노트를 통해서 작업을 수행했지만 요즘에는 다양한 클라우드 기반 노트를 활용하여 작업을 수행하는 편이다. 이번 포스트에서는 클라우드 기반 노트로 데이터 사이언스 프로젝트를 수행할 때 .. 2022. 7. 6.
[Data Science] Side Project: Paddy Doctor Side Project: Paddy Doctor 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Kaggle - Paddy Doctor URL: https://www.kaggle.com/competitions/paddy-disease-classification Paddy Doctor: Paddy Disease Classification | Kaggle www.kaggle.com End Date: 8/31/2022 Paddy Doctor p.. 2022. 7. 3.
[Data Science] Side Project: VAST Challenge 2022 VAST Challenge 2022 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # VAST 2022 https://vast-challenge.github.io/2022/ VAST Challenge 2022 Submissions due: July 13, 2022 11:59PM AOE Challenge Overview In Engagement, Ohio, the future is now! For years this sleepy bedroom.. 2022. 7. 2.
[데이터 사이언스] 캐글 프로젝트(Kaggle Project): Foursquare - Location Matching 캐글 프로젝트(Kaggle Project): Foursquare - Location Matching 포스트 난이도: HOO_Senior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Kaggle Project 캐글 프로젝트(Kaggle project)는 Data science에 대한 공부와 프로젝트 또는 Competition을 참여할 수 있는 커뮤니티 사이트이다. 프로젝트에 직접 참여하지 않더라도 캐글 사이트에서 Data science를 공부하기에도 충분히 괜찮은 사이트이.. 2022. 6. 11.
[알고리즘] Machine Learning Algorithm: Random Forest Machine Learning Algorithm: Random Forest 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Random Forest Algorithm 랜덤 포레스트 알고리즘(Random forest algorithm)은 기계 학습(Machine learning)에서 사용되는 분류와 회귀 분석을 위한 알고리즘 종류 중 하나이다. Machine learning을 통해 수많은 데이터를 분류한다는 것은 중요한 기능 중에 하나이다... 2022. 6. 9.
[알고리즘] Machine Learning Algorithm: Support Vector Machine(SVM) Machine Learning Algorithm: Support Vector Machine(SVM) 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # SVM Support vector machine은 SVM이라고 불리는 Supervised learning(지도 학습) 방식의 Machine learning algorithm이다. Mahcine learning algorithm이면서 Supervised learning에 해당하기 때문에 분류와 .. 2022. 6. 1.
[알고리즘] K-nearest Neighbors Algorithm(K-NN): K-최근접 이웃 알고리즘 K-nearest Neighbors Algorithm(K-NN) 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # KNN Algorithm K-NN 또는 KNN이라고 불리는 K-nearest neighbors algorithm은 Pattern 인식 알고리즘의 한 종류이다. 머신러닝(Machine learning)에서 사용되는 알고리즘이며, K-mean clustering algorithm처럼 데이터 집단을 분류하는 데 사용된다. 이 알고리즘.. 2022. 5. 29.
[알고리즘] K-mean Clustering Algorithm: Clustering이 Linear가 아닐 경우 K-mean Clustering Algorithm: Clustering이 Linear가 아닐 경우 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Linear가 아닌 Clustering 앞선 포스팅에서 K-mean clustering algorithm에 대해서 살펴보았고 일직선에 위치한 데이터 집단을 클러스터링(Clustering)하는 방법에 대해서도 예제를 통해 살펴보았다. 이번 포스트에서는 일직선이 아닌 평면에 임의의 위치에 존재하는 .. 2022. 5. 24.
728x90