생성 AI가 소프트웨어 개발에 미치는 현주소와 전망

본 연구는 2021‑2026년 사이에 발표된 63편의 학술·산업 문헌을 체계적으로 정리하고, 65명의 현업 개발자를 대상으로 한 설문조사를 결합해 생성형 인공지능(GenAI)이 소프트웨어 개발 라이프사이클(SDLC) 각 단계에 미치는 영향을 실증적으로 분석한다. 설문 결과, 설계·구현·테스트·문서화 단계에서 70 % 이상이 생산성 향상을 경험했으며, 79 %가 일일 사용자를 차지한다. 반면 계획·요구사항 단계는 기대 효과가 상대적으로 낮았다. …

저자: Vincent Gurgul, Robin Gubela, Stefan Lessmann

생성 AI가 소프트웨어 개발에 미치는 현주소와 전망
**1. 연구 배경 및 목적** 생성형 인공지능(GenAI), 특히 대규모 언어 모델(LLM)이 소프트웨어 엔지니어링 전반에 빠르게 확산되고 있다. 기존 연구는 개별 SDLC 단계에 국한된 사례 분석이 대부분이며, 전체 라이프사이클을 포괄하는 실증적 근거는 부족했다. 본 논문은 이러한 격차를 메우기 위해(1) 2021‑2026년 사이에 발표된 63편의 학술·산업 문헌을 체계적으로 리뷰하고, (2) 65명의 현업 개발자를 대상으로 설문조사를 실시해 실제 사용 현황과 인식 차이를 정량화한다. **2. 연구 방법** 문헌 검토는 Scopus, IEEE Xplore, ACM DL, SpringerLink, arXiv, Google Scholar 등 6개 데이터베이스를 활용해 “AI‑assisted coding”, “GitHub Copilot”, “generative AI” 등 키워드와 SDLC 단계별 용어를 조합한 복합 검색을 수행했다. 초기 959 044건 중 중복·비영어·2019년 이전 논문을 제외하고 1 712건을 후보로 선정했으며, 제목·초록·전체 텍스트 검토를 거쳐 63편을 최종 포함하였다. 설문은 TAM(Technology Acceptance Model)을 기반으로 도구 사용 빈도, 생산성 인식, 거버넌스 현황, 위험 인식 등을 측정했으며, 응답자는 평균 4.8년 이상의 개발 경력을 가진 전문가들이다. **3. 주요 결과** - **RQ1(사용 현황)**: 79 %가 매일 GenAI를 활용한다. 브라우저 기반 LLM(예: ChatGPT) 사용 비중이 58 %로 가장 높으며, IDE 플러그인형 도구는 42 %가 사용한다. 프롬프트 설계·컨텍스트 제공 능력이 높은 브라우저 모델은 초기 아이디어 구상·요구사항 초안에 주로 쓰이고, IDE 플러그인은 코드 작성·리팩터링에 집중된다. - **RQ2(단계별 영향)**: 설계·구현·테스트·문서화 단계에서 70 % 이상이 “시간 절반 절감” 혹은 “생산성 30 %~50 % 향상”을 경험했다. 특히 보일러플레이트 코드·API 문서 자동 생성이 가장 큰 효율성을 보였다. 반면 계획·요구사항 단계는 35 %만이 실질적 이점을 보고했으며, 주된 활용은 시장 조사·아이디어 정리 수준에 머물렀다. - **RQ3(거버넌스)**: 조직의 66 %가 공식·비공식 가이드라인을 보유하고 있다. 주요 내용은 (1) 데이터 프라이버시·보안 정책, (2) 저작권·라이선스 검토 절차, (3) AI 출력에 대한 코드 리뷰 강화이다. 그러나 실제 적용에서는 AI가 생성한 코드를 자동 병합하거나, 모델 접근 권한을 세분화하지 않는 경우가 다수였다. - **RQ4(위험 인식)**: 개발자는 네 가지 핵심 위험을 강조한다. 첫째, AI가 제시하는 코드의 정확성·보안 취약성; 둘째, 장기적인 스킬 침식·기술 부채 축적; 셋째, 저작권·민감 데이터 유출 가능성; 넷째, 책임 전이·조직 문화 변화. 특히 “AI 출력에 대한 무비판적 수용”이 가장 큰 단기 위험으로 인식되었다. **4. 논의 및 시사점** - **생산성 vs. 품질**: 문헌과 설문 모두 GenAI가 반복적·표준화 작업을 크게 단축하지만, 품질 보증을 위한 인간 검증이 여전히 필요함을 확인한다. - **초기 단계 활용 한계**: 계획·요구사항 단계에서 기대 효과가 낮은 이유는 현재 LLM이 도메인‑특화 지식·비즈니스 로직을 충분히 이해하지 못하기 때문이다. 향후 도메인 맞춤형 프롬프트·파인튜닝이 요구된다. - **거버넌스 성숙도**: 가이드라인이 존재하더라도 실행 단계에서의 구체적 절차(예: AI‑Generated 코드에 대한 자동 테스트·정적 분석 파이프라인) 부재가 위험을 확대한다. - **인간‑인‑루프 설계**: AI 보조 작업 후 반드시 ‘검증·피드백’ 루프를 삽입하고, 이를 KPI(예: AI‑Generated 코드 결함 비율, 리뷰 소요 시간)와 연계해야 지속 가능한 도입이 가능하다. **5. 결론** GenAI는 소프트웨어 개발의 중핵 단계(설계·구현·테스트·문서화)에서 생산성 향상을 주도하고 있으나, 초기 단계와 거버넌스 실행에서 여전히 과제가 남아 있다. 조직은 AI 활용에 대한 명확한 정책·프로세스를 수립하고, 인간‑인‑루프를 강화함으로써 기술 부채·스킬 침식 위험을 최소화해야 한다. 향후 연구는 (1) 도메인‑특화 LLM의 요구사항 단계 적용 가능성, (2) AI‑지원 개발팀의 성과 측정 모델, (3) 장기적인 스킬 변화와 교육 효과를 추적하는 종단 연구 등을 제안한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기