본문 바로가기
728x90

인공지능16

[Algorithms] 머신러닝에서 SMOTE 라이브러리를 통해 데이터 불균형 해소하기: 데이터 수 증가 및 감소 포스트 난이도: HOO_Middle# 데이터 수가 중요한 거지 데이터의 균형이 왜 중요한가요?Machine learning (ML)를 돌리다 보면 충분한 수의 데이터가 마련되지 않는 경우가 있다. 특히 산출하려는 결과가 하나가 아닌 여러 기준을 둔 채 나눠서 산출하려고 한다면 각 기준에 맞는 데이터 수가 필요하다. 예를 들어서 우리가 예측 모델을 만든다고 한다면, 예측하는 값의 기준을 대, 중, 소로 나눈다거나 아니면 카테고리를 가지고 분류를 한다고 했을 때 각 기준에 맞는 충분한 데이터 수가 필요하다. "데이터 수만 많으면 되는 건가요?"라고 오해할 수도 있지만 여기서 한가지 더 중요한 점은 "균형 있는 데이터 수"가 필요하다. 균형 있는 데이터 수라는 건 산출하려는 기준에 비슷한 숫자의 학습 데이터 .. 2025. 3. 31.
[AI & Data] Data Management란 포스트 난이도: HOO_Middle# CS에서의 데이터 관점데이터는 사용되는 맥락에 따라 다양한 정의를 가질 수 있는데 Computer Science (CS)에서의 데이터는 의미 있는 정보 (Information)로 가공되기 전의 기초적인 자료를 의미한다. 예를 들어 일반적 정의 데이터는 이산적(discrete) 또는 연속적(continuous)인 값들의 집합으로, 양적 또는 질적 특성, 사실, 통계, 기본 단위의 의미를 나타내며, 때로는 형식적으로 해석 가능한 기호의 연속으로 정의할 수 있다. 반면에 CS에서의 데이터는 관찰, 실험, 인터뷰, 설문지, 체크리스트, 평정 척도 등을 통해 수집된 원자료(raw data)로, 이러한 자료는 의미 있는 정보로 전환되기 위해 반드시 처리 과정을 거쳐야 한다고 본.. 2025. 1. 25.
[Q&A] 인공지능 프로젝트 결과물을 앱이나 웹사이트로 만들어야 할까요? 인공지능 프로젝트 결과물을 앱이나 웹사이트로 만들어야 할까요? # 프로젝트 시각화, Data Visualization 인공지능 프로그래밍을 하는 개발자들이 말하는 프로젝트의 시각화는 프로그램을 사용하기 위한 시각화를 의미하지 않는다. 현재의 인공지능은 데이터 기반 인공지능이다. 말 그대로 개발자가 준 데이터를 기반으로 인공지능이 학습을 하는 모델이다. 물론 미래에는 인공지능이 자체적으로 인간과 같이 자율형 학습 모델이 될 수도 있지만 현재 대중적으로 사용하고 있는 모델은 데이터 기반이다. 데이터 기반 인공지능은 데이터를 학습하고 목적에 맞는 결과를 산출해내는데 여기서 중요한 점이 학습률과 정확도이다. 인공지능이 얼마나 학습을 잘해서 보다 더 정확한 결과를 산출하는지에 대한 것이다. 이 부분이 바로 인공지.. 2022. 10. 21.
[Machine Learning] Training Dataset vs Testing Dataset Training Dataset vs Testing Dataset 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Dataset Machine learning을 돌리기 위해서는 학습할 데이터가 필요하다. 이러한 데이터들을 모아놓은 하나의 그룹을 우리는 데이터셋(Dataset)이라고 부른다. Machine learning에서 사용되는 데이터셋은 학습하는 데이터의 종류에 따라 이미지가 될 수도 있고 텍스트 파일이 될 수도 있다. Machine .. 2022. 7. 17.
[Q&A] 대학교 2학년 인공지능 공부를 어떻게 해야 할까요? 대학교 2학년 인공지능 공부를 어떻게 해야 할까요? 포스트 난이도: HOO_Junior [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # 대학교 2학년 인공지능 공부를 어떻게 해야 할까요? Q) 컴퓨터 공학과 대학교 2학년 학생입니다. 인공지능과 로봇 분야에 대해서 관심을 가지고 있는데 공부를 어떻게 하면 될까요? 지금은 수업 위주로 듣고 있으며 참여할 수 있는 대외 활동이 있는지 살펴보고 있습니다. # 사람을 위한 인공지능, 기계를 위한 인공지능 인공지능 분야에서도 인공지능.. 2022. 5. 7.
[알고리즘] 필수로 알고 있어야 하는 머신러닝 알고리즘(Machine Learning Algorithms) 필수로 알고 있어야 하는 머신러닝 알고리즘(Machine Learning Algorithms) 포스트 난이도: HOO_Middle [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # Mahcine Learning Algorithms 인공지능 프로그래밍을 배울 생각이 있고 머신러닝을 구현하고 싶다면 기본적으로 알아두면 좋은 알고리즘들이 있다. 특정 프로그램을 만들 때 자주 사용하는 라이브러리를 알아두면 좋은 것처럼 머신러닝을 돌려서 인공지능 프로그램을 만들고 싶다면 알고 있어야 .. 2022. 5. 6.
[Q&A] AI 프로그램과 기존 프로그램의 차이점이 무엇인가요? AI 프로그램과 기존 프로그램의 차이점이 무엇인가요? 포스트 난이도: HOO_Intern [Notice] 포스트 난이도에 대한 설명 안녕하세요, HOOAI의 Henry입니다. Bro들의 질문에 대한 내용을 우선적으로 포스팅이 되다 보니 각각의 포스트에 대한 난이도가 달라서 난이도에 대한 부분을 작성하면 좋겠다는 의견을 들었습니다 whoishoo.tistory.com # AI를 접목시킨 프로그램 AI(Artificial Intelligence)라고 부르는 인공지능 프로그램은 기존 프로그램을 대체하거나 기존 프로그램에 접목시켜 AI 프로그램이라고 부르며 사용하는 경우가 많아졌다. 그렇다 보니 종종 Bro들이 인공지능 프로그램과 기존 프로그램이 도대체 어떤 차이점을 가지고 있는지를 궁금해하는 경우가 있다. 물.. 2022. 3. 9.
[Data Science] Reinforcement Learning(강화학습) Q: 머신러닝 강화 학습이 뭔가요? "머신러닝의 종류"라는 포스트에서 Supervised와 Unsupervised에 차이점에 대해서 살펴보았다. Reinforcement Learning이란? Reinforcement Learning을 직역한 것이 바로 강화 학습이다. 참고로 Reinforcement Learning은 RL이라고 줄여서 표현된다는 점을 알고 있으면 좋다. (Machine Learning은 ML이다.) 필자도 Reinforcement Learning를 RL이라고 포스트에서 줄여서 작성할 것이다. RL의 한국어 직역 표현인 강화 학습이라는 표현이 다소 생소할 수도 있는데, 응용학습이라고 이해하면 보다 더 쉽게 머릿속에 남을 것이다. RL은 머신러닝을 통해 컴퓨터를 학습시키는 방법 중에 하나로써.. 2021. 2. 1.
[Python] open cv란? 인공지능이라고 한다면 컴퓨터가 사람처럼 생각하고 자율적인 사고판단하에 결괏값이 산출되기를 원한다. 컴퓨터가 현실의 사물을 판단하기 위해서는 컴퓨터를 위한 눈이 필요한데, open cv 라이브러리는 컴퓨터가 사물을 인식할 수 있도록 도와준다. open cv 라이브러리가 개발된 목적은 실시간으로 컴퓨터 비전을 목적으로 한 프로그래밍이었지만 안정화와 대중화를 통해 open cv는 다양한 이미지나 영상을 판단하고 원하는 목적으로 결과값을 산출할 수 있도록 도와준다. 인텔 주도하에 개발이 이루어졌지만 제일 중요한 점은 무료로 사용이 가능하다는 것이다. 너무나도 감사하게 무료로 사용할 수 있는 BSD 라이선스이었기 때문에 open cv 개발자와 원저작자에게 감사할 따름이다. 여기서 유의할 점은 open cv에 대한.. 2021. 1. 15.
[Q&A Programming] AI 프로그래머가 되려면 선형대수학 알아야 하나요? AI 프로그래머가 되려면 선형대수학 알아야 하나요? AI 프로그래머에도 분야별로 다양한 종류의 프로그래머로 나뉜다. 하지만 공통적으로 AI 프로그래머는 AI 프로그램을 이용해서 각 분야에 원하는 프로그램을 개발한다. 따라서 구체적으로 따지면 다른 툴과 방식을 사용하지만 크게 보자면 공통적으로 AI 시스템을 사용한다는 것이다. AI, 즉 인공지능이란 사람의 뇌와 비슷한 구조를 가진 딥러닝 방식을 채택하여 만든 프로그래밍 방식이다. 한마디로 엄청난 알고리즘을 통해 다양한 경우의 수에 따른 결괏값을 도출해낼 수 있다. 이러한 다양한 경우의 수를 알고리즘을 통해 컴퓨터에게 알려줘야 하는데, AI 개발자는 알고리즘에 대한 방향성과 문제점을 인식하고 개발해나가야 한다. 이때 필요한 것이 선형대수학 즉, Linear.. 2020. 9. 28.
[Q&A AI] 인공지능(AI)을 왜 알아야 하나요? 인공지능에 대해서 알아야 하는 이유가 뭔가요? 4년 전만 하더라도 4차 산업 시대가 도래했다고 이야기를 하며 강의를 시작했다. 이미 현재에는 4차 산업 기술이 많은 분야에서 활용되고 있으며 이제는 4차 사업 기술을 사용하지 않는 분야가 없을 정도이다. 4차 산업 기술의 오늘 4차 산업 기술 중에서도 대표적인 기술로 손꼽는 기술이 바로 인공지능, AI이다. 그렇다 보니 몇 년 전만해도 생소한 용어였던 AI가 이제는 한 번쯤은 들어봤을 만한 단어가 되어 버렸다. 그만큼 AI라는 것이 일상 생활에 밀접하게 연관이 되어 버린 것이다. 이제는 인공지능이 뭐야?라고 말하는 사람은 없지만 인공지능에 대해서 구체적으로 무엇인지 모르는 사람은 많다. 문제는 인공지능에 대해서 그다지 알고 싶어 하지도 않는 것이다. AI는.. 2020. 5. 29.
[Q&A AI에 빠지다] AI, 인공지능 책 어떤게 좋나요? "형 AI에 대해 공부하려고 하는데 어떤 책이 좋나요?" 프로그래밍에 대해서 공부를 시작하면 정말 막막합니다. 프로그래밍을 공부하는 친구들의 이야기를 들어보면 고민이 많다는 걸 느끼게 됩니다. 공부라는 것이 문제가 있으면 답이 있어야 하지만 프로그래밍이란 정답이 없습니다. 그렇다 보니 프로그래밍을 공부하는 것 자체가 어렵기보다는 일반적 관점의 공부와 접근 방법이 다르다 보니 여기서 어려움을 많이들 느끼는 것 같았습니다. Anyway, 위의 질문은 프로그래밍에서도 AI, AI에서도 머신러닝을 공부하려는 친구에게 받은 질문입니다. 프로그래밍 공부 하기도 막막한데 머신러닝을 공부한다는 것은 더욱 막막할 따름이죠. 답답한 상황이 발생했을 때 사람들은 해결책을 찾거나 포기를 하게 됩니다. 딥러닝 책을 찾는다는 것.. 2020. 5. 28.
[Q&A AI] 딥러닝과 기존 알고리즘의 차이점 형 딥러닝을 이용하는 이유가 뭐예요? 형 딥러닝과 기존에 있던 알고리즘의 차이가 무엇인가요? Deep Learning Data Science에서 흔히들 프로그램을 교육시킨다고 했을 때 딥러닝을 통해 머신러닝을 구현합니다. AI 개발자가 아니더라도 AI에 대해서 듣다보면 빠지지 않고 나오는 말이 바로 Deep Learning이죠. 프로그래밍 공부를 하는 동생들에게 딥러닝에 대해서 물어봤더니, 딥러닝이라는 단어를 듣게 되면 프로그래머에게 있어서 너무나도 먼 존재라는 느낌이 든다고 하더군요. 하지만 알고보면 딥러닝은 우리가 생각하는 것처럼 먼 존재가 아닙니다. 딥러닝과 알고리즘 사실 딥러닝은 알고리즘의 방식 중 하나로 생각하면 됩니다. 알고리즘 방식 중에서 다소 기존의 알고리즘과 차이가 있다는 특징을 가지고 .. 2020. 5. 22.
[Data Science] AI, 머신러닝 개발 환경이란? AI and Machine Learning Environment 인공지능(Artificial Intelligence)은 모든 분야에 활용될 수 있는 기술이며, 이미 다양한 분야와 산업에서 사용되고 있습니다. AI가 다양한 분야에 적용이 가능하다는 것은 어떤 목적을 가지고 AI 프로그램을 개발하여 사용할 것인지에 따라서 개발되는 AI 프로그램도 각기 다른 특성을 가지게 됩니다. 한마디로 AI 프로그래밍에서도 다양한 방법이 존재하기 때문에 목적에 맞는 방식을 사용하여 개발하여야 합니다. AI, 머신러닝 개발환경 구축 AI 개발 방식이 다양하다면 개발 환경 역시 다를 수밖에 없습니다. 예를 들어, 치킨에도 다양한 종류의 치킨이 있고 치킨의 종류에 따라 원재료인 chicken은 들어가지만 부재료는 달라질 수 있.. 2020. 5. 21.
[Data Science] 딥러닝(Deep Learning)이란? Deep Learning 머신러닝(Machine Learning)과 딥러닝(Deep Learning)의 관계에 대해서 정확하게 이해하기 위해서는 딥러닝과 머신러닝이 어떤 역할을 하고 어떤 방식으로 작동이 되는지에 대해서 이해해야 합니다. 딥러닝에 대해서 한 문장으로 요약하자면 딥러닝은 사람의 뇌의 원리를 벤치마킹한 알고리즘 또는 프로그래밍 방식이라고 할 수 있습니다. 우리가 특정 물체를 눈을 통해서 보고 시신경으로 통해서 뇌에 정보가 전달됩니다. 뇌에서는 그것이 어떤 물체인지 판단하여 우리가 인지하도록 도와줍니다. 예를 들어서, 눈 앞에 자동차가 있다고 가정해봅시다. 자동차를 보자마자 우리는 자동차라는 것을 인지합니다. 하지만 사진 속 자동차가 Ford Expedition이라는 모델명을 가진 자동차라는 .. 2020. 5. 13.
[Data Science] 머신러닝(Machine Learning) vs 딥러닝(Deep Learning) 머신러닝 vs 딥러닝 인공지능이라는 단어와 함께 따라오는 것이 바로 머신러닝(Machine Learning)과 딥러닝(Deep Learning)입니다. 특히 Data Science 분야에 대해서 관심 있다면 머신러닝과 딥러닝 다룰 수 밖에 없다보니 너무나도 친한 친구같은 존재입니다. 하지만 처음 Data Sicence나 인공지능 분야에 관심을 두기 시작했다면 머신러닝과 딥러닝이 구체적으로 어떤 관계를 가지고 작동하는지에 대해서 알기가 쉽지 않습니다. 앞으로 머신러닝과 딥러닝에 대해서 구체적이고 실질적인 내용을 포스트를 통해서 다루기로 하고 우선은 딥러닝과 머신러닝이 어떤 차이가 있는지 이야기를 나눠보도록 해보겠습니다. 딥러닝은 머신러닝은 같은 것? 머신러닝과 딥러닝에 대해서 찾아보다 보면 딥러닝은 머신러.. 2020. 5. 13.
728x90