프로젝트/외부 공모전 & 프로젝트

[2022 경남대 빅리더 AI 아카데미] 지역·산업 고용위기 모니터링 및 일자리 미스매칭 해소를 위한 모니터링 서비스 및 솔루션 개발

에멜라 2023. 2. 16. 03:33

빅리더 AI 아카데미_프로젝트_요약기술서_KoDATA_일자리_빅리더_KDATA_20220711.hwp
0.01MB

 

최종 발표본 (1).pptx
5.96MB

(마음 먹은지는 한참 됐지만, 너무 오랜만에 정리해 보는거라 당장 정리가 되어있던 프로젝트 최종 결과물을 먼저 올리게 됐다.)

 

 

 

<한달간 질리도록 본 풍경>

 

2022년 여름, 교수님 추천으로 우연히 지원하여 합격한 "2022 경남대 빅리더 AI 아카데미" (데이터 청년 캠퍼스 과정) 에서 AI 딥러닝 이론 4주 과정 이후, 6주간 기업 연계 프로젝트를 가졌다.

 

우리가 맡았던 주제는 KODATA(한국평가데이터) 가 주관한 프로젝트 주제인

"지역·산업 고용위기 모니터링일자리 미스매칭 해소를 위한 모니터링 서비스 및 솔루션 개발"

이였고, 정확하게 말하면, 한국 산업인력공단의 지역산업 모니터링 시스템 체계화 및 전반적인 솔루션 개발이 목적이였다.

 

빅리더 AI 아카데미를 총괄하신 경남대학교 전종식 교수님과, 프로젝트를 주관하신 Kodata 안영재 부장님께서 다방면으로 신경써 주셔서 프로젝트 선정 및 회의실 제공, kodata 소속 멘토단 지원, 교수진 및 다양한 외부 멘토단 멘토 지원 등 프로젝트 완성을 위해 다양한 지원을 해주셨다.

 

특히 외부 멘토단으로 한국고용정보원 나영돈 원장님 께 직접 발표도 하고 피드백 및 연구 지원도 받아볼 수 있었던 실로 엄청난 기회였는데, 과정도 타이트했고 개인적인 지출도 컸지만 학부생으로서 할 수 있는 프로젝트 중에서 어찌보면 최고 수준의 프로젝트를 해 봤던 기회였고, 무엇보다 인생에서 한번도 얻기 힘든 매우 귀중한 깨달음을 많이 얻어간 경험이었다고 생각한다. 

 


역할 분배 및 개발 과정

팀 AIMS 는 총 5명의 멤버로 구성되었고, 각각 통계학 전공인 나와, 경영 및 기술통계 전공, 소프트웨어학과 2명과 정보보안학과 형 이렇게 구성되어 있었다. 그 중에서 나는 '기획 및 ppt, 분석 및 검증과정 설계, 시각화' 부분에 참여하였다. (사실상 모델의 이해도가 그나마 가장 높아 모델 선생님 역할을 맡기도 했다..ㅎ;)

 

프로젝트 진행 및 개발과정은 약 6주로, 원래는 배경조사 및 기획, 분석계획 설계를 1주일, 이후 대락적인 실서비스 개발에 2주, 그 후 직접 현업 관련자분들과의 피드백을 통해 서비스를 개선해 나갈 계획이였으나, 기획 단계에서 생각보다 많은 피드백을 받으며 프로젝트 방향성을 바꾸느라, 기획을 가다듬는데에 생각보다 너무 많은 시간을 쏱게 되었다.

 

  

<초록색 : 기획> / <파란색 : 전처리 및 모델링> / <보라색 : 대시보드 제작 & 웹 배포>

 

처음에는 현 고용상황에 대한 연구보고서들을 읽으며, 우리 서비스가 누구에게 어떤 도움을 줘야할지 실질적으로 해결할 만한 범위를 설정하고, 이를 통계적으로 해석가능한 모형 (동적 요인 모형, arimaX) 으로 예측하되, 예측성능 향상을 위해 딥러닝 시계열 모형 (LSTM, GRU) 을 병행해서 정확도와 실용성을 동시에 잡고자 했다.

 

정확하게 말하면 딥러닝의 Knowledge distillation 방식과 유사하게, 고용위기를 높은 정확도로 예측하는 딥러닝 모형을 구현하되, 딥러닝의 해석이 불가능한 블랙박스인 점을 해결하기 위해 딥러닝의 예측을 전통 시계열 모형이 계속 모방학습하도록 하여 해석가능한 정확한 모형을 만들고자 했다.

 

그러나 우리가 제시한 기획방향이 의미있는 무언가를 제시하기보다 모델구현 부분에 너무 치우친 점, 시대 상황과 현실적인 사용방안으로 부족한 점, 오래된 모델을 사용한 점 등으로 매 피드백마다 지적을 많이 받았다.

 

그러다보니 프로젝트 과정에서 기획과 우리 서비스가 얼마나 합리적인가에 대해 굉장히 많이 고민을 했고, 모델의 기술적인 측면을 강조하기보다 우리 서비스의 실용성과 지속성에 특히 많은 노력을 기울였던 시간이었다.

 

 


프로젝트 요약

 

프로젝트의 주제 자체가 자체적 솔루션 기획 및 개발에 대한 전반적인 부분을 담고 있어, 문제를 파악하고 그 중에서 우리가 해결 가능한 문제를 선정하여 해결가능한 솔루션을 제안하고 직접 PoC(proof of concept) 까지 만들어 보는 전반적인 과정을 거쳤다.

 

 

 고용위기 및 미스매치 개요

고용위기와 미스매치 등 지역 고용시장 동향은 우리나라에 사회와 경제에 굉장한 영향을 미치는 중요한 문제이다. 이는 단순히 취업률의 문제를 넘어서서, 특정 지역군의 산업 특성과 이에 따른 미스매치와 고용위기의 주기적 발생은 장기적으로 지역 침체를 유발하고, 이는 곧 지역인구 유출 및 지역경제 악화에 까지 영향을 미치며 이러한 악화 사이클은 국가 전반에 경제적 악영향을 몰고 온다.

그렇다면 정부는 현재 고용위기와 미스매치에 대해 어떻게 대응하고 있을까. 크게는 고용노동부와 산업통상자원부가 주관하여 고용위기지역과 고용위기업종을 관리하고 있으며, 각 지자체 및 금융 세제 지원 부처의 연계를 통해 지원금 제도, 각종 세금혜택, 지원정책 등을 보장하고 있다.

그러나 이러한 범부처 차원의 지원정책 시스템이 현재 적재적소에 효율적으로 적용되고 있는가? 여러 연구논문과 사설을 통해 살펴보면 사실 그렇지 못한 것이 중론이다. 현재 고용위기지역 대응방안은 고용위기 자체에 대한 후행적 처사이지 선제적 예방 및 대응 시스템이 전혀 부재하며, 고용위기 관련 처리 부서간 연계 시스템도 거의 없는 상태이다.

 

무엇을 어떻게 할 것인가

1. 기존의 복잡하고 사후적인 위기감지체계
     ⇒ 딥러닝 기반 고용위기지역 예측 시스템 구축

2. 현행 고용위기 관리 부서간 정책 연계성 부족
     ⇒ 고용위기 관련 지표를 한눈에 파악 가능한 전방위적 대시보드 구성 
     ⇒ 한 웹 내에 고용위기 부서가 필요한 데이터의 종류별로 분류해 각 부서내에서 사용가능한 대시보드를 분리해 구성

3. 현행 고용위기 데이터가 부서마다 다원화되어 관리 
     ⇒ 하나의 통합된 DB체계 구축 및 모니터링 자동화

 

데이터 수집 및 전처리

고용위기에 대한 예측을 위한 변수로서 관련 정책 규정, 선행 연구보고서 등을 참고하여 총 24개의 변수 수집
현행 고용위기지역 지정 기준 조건을 충족하는 지역에 대하여 예측변수로서 선정하고 이를 라벨로 하여 지도학습 시행

예측변수와 타겟변수간의 상관관계를 통해 1차 변별, 상관관계가 낮은 변수들은 예측변수에서 제외,
고용위기의 선행예측이 목적이므로 각 변수를 고용위기 선행지표, 동행지표, 후행지표로 분류하여 고용위기 발생 후 나타나는 후행지표의 경우 분석에서 제외하였음.

이에 따라 '수출건 수', '수입건 수', '기업 수', '신규설립 사업자 수' 등 총 13개의 변수가 최종적으로 예측변수로 선정되었다.

 

모델링

각 지역의 지역구 별 특성 산업이 다르기 때문에 예측단위를 시/군/구 단위로 모두 분리하여 각각 예측하였다.

통계데이터 역시 월단위로 수집되므로 윌 단위 시계열 예측을 고려하였고,
예측에 사용된 모델로 특성 변수들의 중요도가 고려 가능한 전통 시계열 모형 ARIMA와 ARIMAX,
금융시계열 분석/예측에 많이 사용되는 LSTM,
Transformer의 시계열 의존성과 관련된 문제를 개선한 장기 시계열 예측모델 Informer
총 4가지 모형을 고려하였다.

 

결론 및 PoC

수집된 약 7년간의 데이터 중 최근 12개월 데이터를 Test set 로 사용하였고, 시계열 교차검증(Time Series Cross- validation) 을 이용하여 4개의 모델에 대한 예측력을 비교하였고, 그 결과 LSTM 모형의 성능이 가장 높았음이 확인되었다.

고용위기지역 예측 데이터와 수집된 유의미한 변수들, 그리고 실제 고용위기 관리 및 대응 기관에서 모니터링하고 있는 여러 데이터들을 실시간으로 파악할 수 있도록 대시보드를 구성하였고, 또 사용의 편의성과 정책적 교류를 위하여 각 지자체에서 필요한 정보를 쉽게 찾아볼 수 있도록 하나의 웹에서 단순히 탭을 선택하는 과정을 통해 타 대쉬보드에도 쉽게 접근할 수 있도록 전체적으로 하나의 웹 사이트로 구성하였다.

미스매치의 경우 지역 시/군/구 등 지역적 특성 뿐 아니라 지역 산업 구성, 업종별 특성, 기업 및 산업 선호도 등 복합적 데이터가 요구되므로 모든 산업군의 특성 변수들을 고려할 수 없어, 울산의 조선업 관련 미스매치에 포커스를 두고  대시보드를 구성하였다.

웹 최종 결과물

<태블로를 활용한 대시보드>

 

 


 

스스로 프로젝트를 돌아보면서 느낀점

돌아보면 사실 내가 경험한 첫 프로젝트이기도 했고, 주제가 어렵다 보니 많은 방황이 있었다. 서툴고, 다투기도 하고,  때론 성숙하지 못했기도 하고, 순간순간의 기억들도 스스로 자랑스럽기보단 사실 창피하고 숨고 싶었던 순간이 너무 많았던것 같다.

 

그런데 반대로 생각해 보면 그만큼 누구보다 열성적으로 프로젝트를 참여했던 시간이었고, 담당 교수님에게도, 멘토님들에게도, 같이 한 형 동생들에게도 정말 많은것을 배울 수 있었던 시간이였던 것 같다.

 

 

 

 

0. 프로젝트를 돌아보며 

처음엔 사실 나보다 경험 많고 뛰어난 리더의 곁에서 누구보다 도움이 되는 팀원이 되고 싶었다. 스펙으로서나 경험으로서나 나보다 뛰어난 사람들이 많아 보였기에 어찌보면 나에 대한 믿음이 스스로 크지 않았던 것 같다.

 

그러나 프로젝트를 진행하면서 생각보다 내가 맡은 역할에 대해 많은 책임감을 느꼈고, 무엇보다 완벽주의적 성격과 특유의 승부욕 때문에 프로젝트 전반적으로 많은 욕심을 냈고, 이런 부분에서 생기는 문제들을 팀원들과 협업하여 유하게 풀어가는 영리함을 펼치기 보다는, 스스로 모든걸 해결하려다 팀원들과 트러블이 생긴것 같다.

  

결론적으로 봤을때, 프로젝트 전반적인 개선 측면에서 교수님들께 프로젝트의 기획을 위해 얼마나 도메인에대한 많은 연구가 선행되어야 하는지와 기획의 중요함을 배울 수 있었고, 반대로 프로젝트 팀원으로서, 같은 팀원들로부터 협업과정에서의 위기 관리나 대처 측면에서 조언을 많이 구하기도 했으며, 무엇보다 힘든 자리임에도 불구하고 묵묵히 자기자리를 지켰던 어린 동생을 보며 협업속에서 리더가 해야할 모습들과 갖춰야할 자격들에 대해서도 상당히 많은 부분들을 어깨너머 배웠던 것 같다.

 

1. 스스로 부족한 것들과 개선해야될 것들


프로젝트 전반적으로 상대방 의견을 듣고 빠르게 이해하며 자기의 의견을 적절하게 표출하는 능력이 필요함을 느꼈다.  특히 내가 어떤 부분에 대해서 더 알고있을 때 그것을 적절하게 표출하고 리드할줄 아는것도 중요했다.


리더쉽에 대해서도 생각을 많이 했는데, 내가 무언가를 제시하고 싶다면 그 말에 책임을 질 용기도 필요했고, 그것을 실제로 증명하기 위해 내가 한발 더 뛰어야 된다는 것도 깨달았다. 무엇보다, 적어도 내 스스로가 불안하더라도 팀원들에게 만큼은 자신감 있는 모습이나 책임감 있는 모습을 통해서 팀원들이 불안해하지 않도록 공동체 자체를 잘 관리하는것도 중요함을 깨달았다. 

 

프로젝트를 마치며 스스로를 정리해보면서, 앞으로 내가 개선했으면 하는 점들을 기록했고, 이런 부분들을 하나씩 채워나가며 협업 능력과 내 부족한 부분들을 채워나가고자 한다.

 

 

<보충해 나가야 할 것들>  (23년 7월 기준 어느정도 완료한 것들 ✔️)

  1. 이야기, 문맥 파악하는 연습 필요 
    • 책을 많이 읽어보고, 글 많이 써보기 ✔️
    • 고등학교때 했던 사설 독후감 작성해보기
  2. 소통을 많이 해보기, 프로젝트 등 커뮤니케이션 활동 많이 해보기
    • 공모전이나 프로젝트 등 협업 경험 많이 해보기 ✔️
    • 스터디나 면접 준비 등 말하기 연습 ✔️
  3. 전공지식을 제대로 알자. 그리고 전공지식에 대한 설명을 많이 해보자
    • 평소에 아는것을 정리하고 가르쳐주는것을 좋아하는데 이런 취미를 살려보자 ✔️
    • 유튜브나 블로그들을 활용하여 관련 지식을 쭉 정리해보자 ✔️
  4.  주도적으로 리드해보기
    • 앞으로의 활동에서 주도적으로 활동해보기 ✔️
    • 내가 생각하는 리더쉽 : 먼저 주도, 궂은일에 선뜻 나서기(팀원 참여 독려), 자신있게 부딛히기, 비판을 감수하기 ✔️
  5. 발표 해보기
    • 발표경험 늘리기 ✔️
    • 내가 알고있는 내용을 조리있게 정리하여 말하는 경험 많이 해보기 ✔️

 

 

 

2. 프로젝트 기획에 대한 깨달음

프로젝트 과정에서 why에 대해 정말 많은 비판 과정과 수정 과정을 거쳤다. 특히 무엇을 할 건지를 짧고 명확하게 전달하는 것이 중요했다. 그러기 위해서 가장 효율적인 도구가 공감이였고, 넓은 범위에서 우리의 task로 끌고가는 과정이 굉장히 중요하다고 느꼈다. 그렇게 된다면 자연스럽게 우리는 모두가 느끼는 문제에 대해 우리의 솔루션이 정당하게 필요함을 쉽게 전달할 수 있였다.

 

그리고 중요한것들을 효율적으로 표현하고, 필요없는 것들은 덜어내는 과정도 필요함을 느꼈다. 사실 우리는 정말 어려운 문제에 대해, 매우 어렵고 복잡한 모델로 해결하고자 하여 불필요하게 너무 시간을 많이 투자하지 않았나 싶고, 사실 초반 ppt를 보면 이러한 불필요한 과정들이 그대로 담겨있다. 

 

우리는 몇번의 피드백 이후에야, 우리가 실질적으로 필요한 것이 이 발표를 듣는 사람들을 설득하는 것이며, 그 사람들에게 불필요한 어려운 내용들보다 실질적인 설득에 도움이 되는(될 것 같아보이도록 설득할 수 있는) 해결책과 그것을 제시하는 논리가 굉장히 중요함을 느꼈다.

 

 그리고 이것이 정말 잘못가고 있다고 느껴진다면, 바로 과감하게 하산하고 돌아가라는 말도 기억에 많이 남는다.

 

 

 

 

+ ) 다른 조들을 보면서 느낀점

경남대 빅리더 프로젝트 과정에서 1등을 차지한 산단발차기를 보면,  esg 지원금 제도 우선신청대상기업 탐색 이라는 프로젝트는 esg 지원금 사업과정을 기존처럼 기업 신청을 받는것이 아니라 지원해줄 기업, esg 평가에 해당될만한 기업을 탐색하고 그중에 위험도가 높은 기업, 산업, 위치들을 실시간으로 확인할 수 있게 하여 우선적으로 지원금을 직접 제공하자는 서비스였다.

esg 평가가 무엇인지, 왜 필요한지, 누구에게 필요한지, 어떻게 해결할건지,  최종적으로 본인들이 만든 솔루션을 보여주며 어떻게 사용하면 되는지를 본격적으로 시연한 이후, 모델에 대한 설명을 간단하게 이어갔다. 어찌보면 다른 조들이 <개요 - 모델 - 서비스> 로 두며 "모델" 에 하이라이트를 둔것과는 반대로, 순서를 반대로 꼬면서 "솔루션" 에 집중하도록 한것이 굉장히 재미있게 느껴졌다. 그리고 추가적으로 발표가 굉장히 재미있고 유하게 흘려가면서 발표자체가 모델 설명과 같이 딱딱하기보다, 굉장히 듣기 좋은 이야기 정도로 들렸던것도 좋았던것 같다.

 

=========================================================================================


2등은 레인져스 팀으로 기존의 식생지수 계산을 cctv로 관측하여 직접 했다면, CCTV 상의 화면과 gps 시스템을 통한 위성 사진 데이터를 합성하여 식생지수를 자동으로 계산해주는 프로젝트를 기획했다. 기존의 gis기술과 gps기술을 동시에 활용한 사례가 기존에 없었다고 하며 이러한 아이디어가 굉장히 뛰어났다고 평가했다.

 

특히 gis 시스템을 누구나 횔용할 수 있도록 개선한 프로그램을 제시했는데, 이는 기존의 gis시스템이 전문가들이 사용하는데 있어 불편한 점이 많고 접근성이 떨어지는 프로그램이였는데, 이를 누구나 사용할수 있도록, 누구나 식생지수를 계산할 수 있도록 하는 시스템으로서 의의가 있다고 설명해주셨다. 이 팀도 발표가 굉장히 깔끔하고 재미있었던 것 같다 

 

========================================================================================

 

1,2등 그리고 타 팀의 발표를 보면서 사실 목표가 되게 뚜렷했다고 생각도 많이 들었다. 물론 우리 주제가 굉장히 목표를 잡기 어려웠던 것은 사실이나, 우리도 스코프를 좁혀서 이렇게 특정 문제를 똑바로 잡고, 이에 대한 명확하고 깔끔한 솔루션을 고민했으면 어땠을까 싶었다.

 

그리고 기획이나 발표에 있어서도, 너무 문제를 심각하게 받아들이고 딱딱하게 구성하는것보다, 모델은 모델나름 완성도를 높이되 발표자체를 되게 깔끔하고 재미있게 구성해서 최종적으로 발표때는 발표에만 집중할 수 있도록 하는것도 좋은 방식이라 생각이 들었다.