본문 바로가기
AI & Data

[Data Science] Soft System Methodology (연성체계 방법론)

by Henry Cho 2023. 9. 1.
728x90

Soft System Methodology (연성체계 방법론)

포스트 난이도: HOO_Senior


# Soft System Methodology (SSM)

한국에서는 연성체계 방법론이라고 불리는 Soft System Methodology (SSM)의 경우 문제점을 이해하고 분석해야 하는 과학 분야에서 많이 사용하는 기초 분석 방법론이다. 데이터 사이언스 (Data science)에서도 SSM이 필요한 이유는 사실상 공학과 과학을 모두 다루는 분야이기 때문이다. 데이터 사이언스에는 크게 데이터 분석, 엔지니어, 사이언스 등으로 나뉘는데, 데이터 사이언스의 경우 분석과 엔지니어링을 모두 포함한 상태에서 문제 원인과 앞으로 예측까지를 모두 해낼 수 있어야 하기에 SSM과 같은 방법론을 다룰 줄 알아야 한다. 사실 SSM의 경우에는 과학 분야 외에도 비즈니스 계열에 있어서도 문제점을 파악하는데 용이하게 실생활에서 복잡한 문제를 해결하는데 많이 사용되고 있는 방법론 중 하나이다.


# 데이터 사이언스의 SSM

데이터 사이언스 (Data science)에서의 SSM을 사용하는 가장 큰 이유는 사실상 원인 분석이 쉽지 않다는 것이다. SSM은 complexity한 문제를 해결하는데 용이한 방법론이기에 복잡한 다수의 경우의 수를 분석하고 예측해야 하는 데이터사이언스에 있어서는 필요한 요소이다. 우리가 Hard tools라고 부르는 데이터 분석 모델이나 기법들의 경우에는 사실상 현실과 동일한 모델을 구현할 수가 없다. simplified 하는 과정에서 모델이 현실과 다른 점이 발생할 수 있고 데이터 수집 자체에서도 현실과의 차이가 발생할 수 있다. 심지어 아무리 완벽한 데이터 수집을 토대로 모델을 구현했다고 할지라도 현실에서의 모델이 변화되면 결국에는 차이점이 발생할 수밖에 없다. 이렇기에 우리는 아무리 완벽한 모델을 만들어냈다고 할지라도 지속적으로 데이터를 수집하고 가공하여 모델을 업데이트를 하거나 새로운 관점에서 모델을 만들어내곤 한다. 이때 이러한 다수의 경우를 고려하여 문제점을 파악하고 Hard tools을 쉽고 효율적으로 만들어 내기 위해서 SSM이 필요한 것이다.


# Research tools are not unbiased

케이팝 스타라고 불리는 한국 아이돌은 한국을 대표하고 있다. 하지만 티비에 나오는 한국 아이돌들이 가진 성향이나 외모가 한국인 전부를 대변하지는 않는다. 예컨대 글쓴이의 얼굴을 보더라도 아이돌만큼 잘생기지 않았고 패션에도 관심이 없다. (그래서 미국 친구들은 글쓴이를 보고 패션이 미국화가 되었다고 한다.)

아무튼 글쓴이가 예시를 토대로 말하고자 한 바는 데이터를 기반으로 만들어진 모델이 모든 상황과 경우를 나타내지는 못한다는 것이다. 글쓴이가 한국 아이돌과 똑같지 않듯이 현실의 상황과 research tools은 동일할 수가 없다. 문제는 research tools들은 이러한 차이를 인지하지 못한다는 것이다. 따라서 우리는 일기예보와 같이 오랜 연구를 토대로 모델 시스템을 만들었고 지속적으로 연구와 업데이트를 함에도 100% 일치하는 모델을 만들어낼 수 없다는 점을 인지하고 원인에 대한 경우를 분석하고 이해해 나가야 한다는 것이다. 그렇기에 우리는 이러한 과정을 보다 더 편하고 쉽게 이해하기 위해 SSM를 Data scinece 분야에서 적극적으로 활용하고 있다.


 

728x90

댓글