16 min read

누구나 따라할 수 있는 챗GPT 데이터분석

최근 인공지능 분야의 핫 이슈인 챗GPT의 ADA(Advanced Data Analysis) 기능에 주목! 파이썬 코드 작성 및 실행으로 데이터 분석의 접근성을 혁신적으로 개선한 챗GPT. 본 포스팅에서는 데이터 분석의 기본부터 실제 적용까지, 챗GPT를 활용하는 방법을 알아보며, 데이터 분석 초보자도 쉽게 도전할 수 있는 길을 제시합니다. 데이터 분석의 전 과정을 함께 거치며 숨겨진 인사이트 발견의 짜릿함을 경험해 보세요.
누구나 따라할 수 있는 챗GPT 데이터분석

이번 콘텐츠 내용은 여러분이 직접 따라해보길 권장합니다. '누구나 따라할 수 있는 챗GPT 데이터 분석'을 체감해보세요! 아래 버튼을 클릭하여 데이터 분석용 실습 자료를 다운로드 받을 수 있어요.


챗GPT 강점 - 데이터분석

안녕하세요, 여러분! 최근 인공지능 분야에서 가장 뜨거운 화두인 챗GPT에 대해 들어보셨나요? 지난 포스팅에서 소개해드렸듯이, 현재 대표적인 LLM 서비스로는 챗GPT, Claude, Gemini가 있습니다.

그중에서도 챗GPT만이 가진 독보적인 기능이 바로 ADA(Advanced Data Analysis)인데요. 이 기능은 파이썬 코드를 작성하고 챗GPT 대화창에서 바로 실행하여 결과를 확인할 수 있게 해줍니다. 심지어 오류가 발생하면 스스로 디버깅까지 해내죠. 이로 인해 간단한 파이썬 코드를 활용하는 업무에 대한 접근성이 크게 개선되었습니다.

ADA 기능을 통해 우리는 데이터 분석을 보다 쉽게 접근할 수 있게 되었는데요. 오늘은 이 놀라운 챗GPT의 ADA 기능을 활용하여 데이터 분석을 수행하는 방법에 대해 알아보도록 하겠습니다.

우선 데이터 분석이 정확히 무엇인지 간단히 짚어보고, 데이터 분석을 처음 접하는 실무자들이 겪을 수 있는 어려움에 대해 살펴볼 거예요. 그리고 나서 실제로 챗GPT를 통해 데이터 분석을 진행해보고, 그 결과를 토대로 의미 있는 보고서를 작성하는 과정까지 함께 경험해 보겠습니다. 준비 되셨나요? 그럼 출발해 볼까요?

*데이터 분석은 챗GPT 중급 이상의 사용자들을 위한 기능입니다. 여기를 클릭하여 챗GPT 프롬프트 엔지니어링 기초를 마스터하면 오늘 과정을 쉽게 익힐 수 있습니다.


데이터 분석? 들어보긴 했는데...

데이터 분석이란 비즈니스 의사 결정에 도움이 되는 정보를 도출하기 위해 데이터를 수집, 처리, 분석하는 일련의 과정을 말합니다. 데이터에 숨겨진 패턴이나 인사이트를 발견함으로써 현상을 이해하고 미래를 예측할 수 있게 되죠. 최근에는 빅데이터와 인공지능 기술의 발전으로 데이터 분석의 중요성이 날로 커지고 있습니다.

하지만 데이터 분석이라는 말을 들어봤어도 정작 어떻게 시작해야 할지 막막한 분들이 많으시죠. 데이터는 어떻게 수집하고 어떤 방법으로 분석해야 하는 걸까요? 통계와 프로그래밍 지식이 부족하다면 데이터 분석은 너무 어려운 것 아닐까요? 이런 고민들 때문에 데이터 분석에 선뜻 도전하지 못하는 분들이 적지 않습니다.

그런데 여러분, 챗GPT가 있다면 걱정 마세요! 이제 챗GPT를 활용한다면 누구나 데이터 분석에 도전해 볼 수 있게 되었거든요. 관련 전문 지식이 부족하더라도 챗GPT가 여러분을 도와줄 테니까요.

데이터 분석 진행하기

챗GPT를 활용한 데이터 분석은 어떤 과정으로 진행될까요? 오늘 소개할 데이터 분석 사례는 다음과 같은 순서로 이루어집니다.

  1. 챗GPT에게 분석할 데이터를 제공하고 인지시킵니다.
  2. EDA(Exploratory Data Analysis), 즉 탐색적 데이터 분석을 진행합니다.
  3. 관심 있는 특정 '요소'를 선정하고, 이를 기준으로 다른 모든 요소와의 상관관계 분석을 수행합니다.
  4. 분석 결과를 바탕으로 가설을 세우고 검증합니다.
  5. 마지막으로 분석 내용을 정리하여 보고서를 작성합니다.

특히 챗GPT를 활용하면 사람이 직접 분석할 때보다 훨씬 거시적인 관점에서 데이터 분석 작업을 진행할 수 있는데요.

  • 탐색적 데이터 분석(Exploratory Data Analysis, EDA)을 통해 다양한 관점으로 데이터의 구조를 확인하고 및 간단한 인사이트를 확인할 수 있습니다.
  • 우리가 집중하고 싶은 특정 요소를 챗GPT에게 알려주면, 그 요소와 연관된 모든 다른 요소들의 상관관계를 빠르고 정확하게 분석해 줍니다.

사람이 하기에는 지루하고 시간이 많이 소요되는 작업이지만, 인공지능에게는 아주 손쉬운 일이랍니다. 이런 방식으로 데이터를 분석하면 보다 전체적이고 입체적인 시각을 가질 수 있고, 이는 현실성 있는 가설을 수립하는 데 큰 도움이 됩니다.

챗GPT를 활용하면 보다 꼼꼼한 데이터 분석을 '쉽게' 진행할 수 있다

물론 실제 데이터 분석 프로젝트를 진행할 때는 상황에 맞게 분석 절차를 구체적으로 정의하고 필요에 따라 유연하게 조정해야겠죠. 이 부분은 실무자인 여러분의 역량이 발휘되어야 할 영역이에요. 오늘은 챗GPT를 활용해 데이터 분석을 수행하는 전반적인 흐름에 대해 알아보는 것에 초점을 맞추도록 하겠습니다.

자, 그럼 실제 데이터로 한번 분석을 진행해 볼까요? 케글에서 제공한 IMB HR 데이터를 가지고 직원들의 '성과 평가' 점수에 어떤 요인들이 영향을 미치는지 살펴보고, 그에 따른 개선 방안까지 모색해 보도록 하겠습니다. 챗GPT와 함께하는 흥미진진한 데이터 분석의 여정, 지금부터 시작합니다!


1. 데이터 업로드 및 인지시키기

데이터 분석의 첫 단추는 바로 챗GPT에게 분석할 데이터를 전달하고 이를 인지시키는 것입니다. 데이터 파일을 업로드한 후 바로 분석 작업을 지시할 수도 있겠지만, 단계를 나누어 진행하는 편이 더 나은 결과를 기대할 수 있어요. 한 번에 너무 많은 작업을 요청하면 챗GPT가 각 단계에 집중하지 못하고 대충 처리해 버릴 수 있거든요.

처음에는 데이터에 어떤 열(column)이 있는지, 어떻게 구성되어 있는지를 살펴보고 요약해 달라고 요청하는 거예요. 이렇게 데이터의 구조와 특성을 파악하는 과정이 후속 분석에 큰 도움이 된답니다.

데이터 분석 1단계 - 데이터 인지시키기

2. EDA(Exploratory Data Analysis) 진행하기

EDA, 즉 탐색적 데이터 분석은 본격적인 분석에 앞서 데이터를 다각도로 살펴보는 과정입니다. 이를 통해 데이터의 특징과 패턴을 파악하고, 이상치나 특이점 등을 발견할 수 있죠. 변수들 간의 관계를 살펴보는 것도 EDA의 중요한 목적 중 하나예요.

EDA는 크게 4가지 방식으로 진행할 수 있습니다.

  • 단변량 비시각화 기법(Uni-variate Non-Graphical)
  • 단변량 시각화 기법(Uni-variate Graphical)
  • 다변량 비시각화 기법(Multi-variate Non-Graphical)
  • 다변량 시각화 기법(Multi-variate Graphical)

단변량 분석은 개별 변수의 특성을, 다변량 분석은 여러 변수 간의 관계를 살피는 거예요. 그리고 시각화를 활용하면 더욱 직관적으로 데이터의 특징을 파악할 수 있죠.

데이터 분석 2단계 - EDA(Exploratory Data Analysis) 진행 - 일변량 비시각화

데이터 분석 2단계 - EDA(Exploratory Data Analysis) 진행 - 일변량 시각화

데이터 분석 2단계 - EDA(Exploratory Data Analysis) 진행 - 다변량 비시각화

데이터 분석 2단계 - EDA(Exploratory Data Analysis) 진행 - 다변량 시각화

이처럼 EDA는 본격적인 분석에 앞서 수행하는 일종의 '정찰' 과정이라고 할 수 있어요. 아직 가설을 세우기 전이라 분석가의 주관이 개입될 여지가 적기 때문에, 이 단계는 챗GPT에게 맡겨도 좋습니다.

3. 상관관계 분석을 통한 인사이트 발견

저는 이번에 분석하는 HR 데이터에서 '성과 평가' 점수에 영향을 주는 요인이 무엇일지 궁금하네요. '연봉이 중요할까?', '근무 지역에 따라 차이가 있을까?', '상사의 역량이나 부하 직원과의 관계가 영향을 미치지 않을까?' 등 여러 가설을 세워볼 수 있겠죠.

하지만 저는 챗GPT에게 '성과 평가'와 관련이 있을 법한 모든 요소를 나열한 뒤, 각각의 상관관계를 분석해 달라고 요청할 거예요. 우리 머릿속에 떠오르는 몇 가지 가설만 검증하기보다는, 가능한 모든 조합을 살펴보는 셈이죠. 그러면 우리가 미처 생각하지 못했던 숨은 인사이트를 발견할 수 있을 거예요.

데이터 분석 3단계 - 상관관계 분석을 통한 인사이트 발견
데이터 분석 3단계 - 상관관계 분석을 통한 인사이트 발견 후 시각화

'성과 평가(Performance Rating)'를 기준으로 상관관계 분석을 진행했을 때, '연봉 인상률(Percent Salary Hike)'이 가장 높은 상관을 갖는 것으로 파악됐어요. 제시된 데이터만 봤을 땐, '연봉 인상률'을 제외하면 다른 지표는 '성과 평가'와 유의미한 상관관계를 갖지 않았어요.

4. 추가 가설 생성 및 검증

앞선 상관관계 분석을 통해 흥미로운 사실을 여럿 알아냈어요. 이제 이를 바탕으로 보다 구체적이고 발전된 가설을 세워볼 수 있겠죠. HR 전문가라면 축적된 지식과 경험을 활용해 더욱 날카로운 가설을 제시할 수 있을 거예요.

다만 저는 HR 분야에 대한 배경 지식이 부족해요. 그래서 챗GPT에게 조금 더 깊이 있는 분석을 위한 추가적인 가설과 필요한 데이터를 제안해 달라고 요청했습니다. 안타깝게도 제가 가진 데이터가 한정되어 있고, 이 콘텐츠의 분량도 제한되어 있어서 여기까지만 분석을 진행하려고 해요.

데이터 분석 4단계 - 추가 가설 생성 및 검증

챗GPT는 '성과 평가'와 '급여 인상 비율'의 상관 요소를 더욱 자세히 살펴보기 위한 방안을 제시했어요. 현업에서 데이터 분석을 진행하시는 여러분이라면 사내 데이터를 활용해서 더 자세한 데이터 분석까지 진행해볼 수 있겠죠?

5. 보고서 작성하기

드디어 데이터 분석의 마지막 단계, 보고서 작성이에요. 분석 과정에서 얻은 인사이트와 결과물을 정리해서 잘 전달하는 것이 중요하죠. 이 단계에서는 프롬프트 엔지니어링 기법의 진가를 발휘할 수 있어요. 하지만 이번 사례에서는 '데이터 분석' 자체에 초점을 맞추고자 해요. 그래서 간단한 프롬프트만으로 챗GPT에게 보고서를 작성해 달라고 요청했습니다.

데이터 분석 5단계 - 보고서 작성하기

이렇게 '데이터 분석 진행하기'의 각 하위 항목에 대해 자세히 살펴봤는데요. 각 단계를 차근차근 밟아 나가면서 챗GPT의 역량을 적극 활용하는 것이 효과적인 데이터 분석의 핵심이에요. 물론 실전에서는 더 복잡하고 전문적인 과정이 필요하겠지만, 오늘은 챗GPT를 활용한 데이터 분석의 기본 흐름을 느껴보는 것에 의의를 두겠습니다.

어때요, 챗GPT와 함께라면 데이터 분석이 한결 친근하게 느껴지지 않나요? 이제 여러분도 데이터 분석에 도전해 볼 준비가 된 것 같네요. 자, 그럼 챗GPT와 손잡고 데이터의 바다로 뛰어들어 볼까요? 숨겨진 보물을 찾아내는 짜릿한 경험이 기다리고 있을 거예요!


주의사항

  • 챗GPT의 분석 결과를 맹신하지 말 것
    • 특히 데이터 분석 초심자일수록 주의 필요
    • 결과를 충분히 검토하지 않고 활용 시 부작용 발생 가능
  • 전문 지식과 경험을 바탕으로 챗GPT와 협업할 것
    • 도메인 이해도, 통계 역량, 업무 맥락을 고려한 분석 수행
    • 챗GPT에게 모든 것을 맡기기보다 전문성을 활용해 협업
  • 데이터 분석에 정답은 없음을 인지할 것
    • 분석가의 가설과 이를 뒷받침하는 데이터 패턴이 핵심

챗GPT와 함께라면 누구나 할 수 있는 데이터 분석

챗GPT를 활용한 데이터 분석은 누구나 시작할 수 있는 멋진 도전입니다. 전문가가 되기 위해서는 많은 공부와 훈련이 필요하겠지만, 챗GPT와 함께라면 보다 빠르게 데이터 분석의 고수로 거듭날 수 있을 거에요.

데이터 분석의 매력은 단순히 숫자를 다루는 것이 아니라, 데이터에 담긴 이야기를 읽어내고 새로운 인사이트를 발견하는 것에 있습니다. 이제 여러분도 챗GPT와 함께 이 놀라운 여정을 시작해 보세요. 데이터 분석을 통해 새로운 가치를 창출하는 기쁨을 맛보게 될 거예요.

자, 출발해 볼까요? 눈부신 발견과 성취가 여러분을 기다리고 있습니다. 건투를 빕니다!


AI Ground 교육이 제공하는 차별화된 학습 경험

AI Ground 교육 프로그램은 기업 실무에서 생성형 AI 기술을 효과적으로 활용할 수 있는 역량을 기르는 것을 목표로 하고 있습니다. 이론 교육과 함께 실습 위주의 체험식 학습을 강조하는 것이 교육 철학입니다.

  • 다양한 생성형 AI 도구를 직접 활용해볼 수 있는 실습 기회 제공
  • 기업에서 실제로 마주칠 수 있는 문제 상황을 가정한 프로젝트 수행
  • 유료 ChatGPT 계정 대여를 통한 데이터 처리/분석/시각화, 웹 검색, 파일 학습 등 고급 기능 활용 실습

AI 실무 적용, 어렵지 않아요!

생생한 사례와 전문가의 노하우가 가득한
AI Ground 뉴스레터에서 디지털 전환의 시대를 미리 준비하세요.
지금 바로 구독하고 AI 활용의 노하우를 만나보세요!