현업이 만드는 AI, 사내에 남는 역량
현업 바이브 코딩 기반 5대 AI 적용 시스템 구축 및 AI 리터러시 내재화 제안
제안사: MKVista · 제출처: 원익홀딩스 · 사업기간: 2026.07.01 착수 ~ 2026.10.30 (구축 완료 목표 2026.10.25)
"There's a new kind of coding I call 'vibe coding' — you fully give in to the vibes ... and forget that the code even exists."
— Andrej Karpathy, 2025 ([출처: Wikipedia "Vibe coding"]). 2025년 Collins 영어사전 '올해의 단어' 선정.
본 제안의 상품은 '대신 만들어 주는 AI'가 아니라 현업이 스스로 만들고, 끝난 뒤에도 사내에 남는 AI 역량입니다. 수행사는 환경·코드리뷰·보안·코칭의 안전망을, 현업은 과제정의와 개발의 주체를, 발주사 CFO-IT는 인프라·연동을 맡는 3주체 협업으로, 5개 부서 5개 시스템을 2026.07.01 착수 → 10.25 구축 완료(사업종료 10.30 전 안정화 버퍼)하고 운영을 사내로 이관합니다.
1. 제안 요약 (Executive Summary)
원익홀딩스는 반도체·디스플레이 소재·부품·장비(특수가스) 그룹으로 [사실: 원익홀딩스 공식], 품질·구매·해외영업·안전환경·연구소 5개 현업 부서가 수작업·속인화된 업무에 시간을 과도하게 쓰고 있습니다 [사실: RFP slide3~7]. 본 RFP는 이를 현업이 직접 바이브 코딩으로 만드는 AI로 전환하고, 동시에 AI 리터러시를 사내에 내재화할 것을 요구합니다 [사실: RFP slide2].
우리는 세 가지 가치를 약속합니다.
| 핵심 가치 | 무엇을 | 어떻게 (근거) |
|---|---|---|
| ① 완수 | 5개 시스템을 기간 내 구축 완료 | 공통 플랫폼 선구축 + MVP 우선 + 단계 실증 + 리스크 레지스터. AI 프로젝트 80%+가 실패([추정→사실] RAND 2024)하는 이유가 기술이 아니라 '완수 역량'이기 때문 |
| ② 현업 주도 | 현업이 직접 개발하는 표준 방법론 | 과제정의서→바이브코딩→코드리뷰→UAT 사이클 + 현업용 스킬·MCP 도구 + 부서 코치. AI 코드어시스턴트 사용 엔지니어가 2028년 75%로 보편화(사실 Gartner) |
| ③ 역량 내재화 | 교육 + 현업 AI 활용 전문가 양성 + 완전 이관 | 레벨별 커리큘럼·핸즈온·AI 활용 전문가 양성으로 종료 후 자체 운영. 기업의 AI 도입은 88%지만 유의미 성과는 6%뿐(사실 McKinsey 2025) — 차이는 '워크플로우 재설계와 이관' |
RFP 3대 추진방향과의 정합성 — 본 제안의 설계는 RFP가 제시한 3대 추진방향에 1:1로 대응합니다 [사실: RFP slide2].
| RFP 추진방향 (slide2) | 본 제안의 대응 | 반영 |
|---|---|---|
| ① AI 리터러시 내재화 (이해·활용·분별력) | 레벨별 교육 L1~L3 + 현업 AI 활용 전문가 양성 + 완전 이관 | §7 |
| ② 현업주도 AI 적용 (작은 사례부터 실증 확산) | 현업 바이브코딩 표준 사이클 + MVP 우선 + 단계 실증 | §5·§6 |
| ③ AI+IT 결합 실행역량 증강 (AI와 IT가 결합한 업무 수행체계) | 공통 AI 플랫폼 ↔ 사내 시스템(QDMS·구매DB·SOP) 연동 + CFO-IT 협업 RACI + GB10 온프레미스 | §4·§9·§11 |
핵심 메시지: 이 제안의 차별점은 기술 자체가 아니라, '도입'에서 끝나지 않고 '완수와 내재화'에 도달시키는 방법론·교육·안전망입니다.
2. RFP 이해와 현황 분석 (발주사 관점)
2.1 발주사가 직면한 두 겹의 과제
겉의 과제 — 5개 부서 공통으로, 핵심 업무가 수작업·속인화되어 시간 과다·품질 편차·업무 연속성 결여가 발생합니다 [사실: RFP slide3~7]. 예) 품질 보고서 작성 2~3시간, 위험성평가 건당 2시간, 유량-차압 곡선 추출 곡선당 10분.
속의 과제(진짜 난제) — RFP는 "현업이 직접 만든다"를 전제하지만, 현업은 전문 개발자가 아닙니다. 따라서 단순히 AI 도구를 쥐여주는 것만으로는 작동하지 않습니다. 실제로 숙련 개발자조차 AI 사용 시 오히려 19% 더 오래 걸렸다는 통제실험(사실 METR 2025)과, 주니어는 7~10% 생산성이 하락했다는 분석(사실 McKinsey 2023)이 있습니다. 즉, 도구가 아니라 "적용 영역 선별 · 교육 · 가드레일 · 측정"이 동반될 때만 효과가 발현됩니다. 본 제안의 설계 전체가 이 진실에서 출발합니다.
2.2 왜 지금인가 (배경 근거)
- 기술 변곡점: 자연어로 코드를 생성하는 '바이브 코딩'이 정식 산업 용어로 자리잡았고(2025 Collins 올해의 단어 사실), 최전선 스타트업의 25%가 코드베이스의 95%를 AI로 생성합니다(사실 TechCrunch 2025.3). 개발 주도권이 IT→현업으로 이동 중입니다(사실 Gartner: AI코드어시스턴트 2028년 75%).
- 제조 AI는 블루오션: 국내 제조기업의 AI 도입률은 0.1%에 불과합니다(사실 중기부 2024). 먼저 내재화하는 조직이 격차를 만듭니다. 스마트공장 도입 기업은 생산성 30%↑·품질 43.5%↑·산업재해 18.3%↓를 실증했습니다(사실 중기부 2019).
- 안전 규제 강화: 중대재해처벌법이 2022.1.27 시행되어 2024.1.27부터 5인 이상 사업장 전면 적용되며, 사망사고 시 경영책임자가 1년 이상 징역 또는 10억 원 이하 벌금 대상입니다(사실 법제처). 위험성평가(산안법 제36조)는 모든 사업주의 법적 의무입니다(사실 법제처) — 과제4의 시급성.
2.3 5개 부서 AS-IS 요약
| 부서 | 현행 통증 (AS-IS) | 정량 KPI 목표 |
|---|---|---|
| 품질 | QDMS 수동 가공·수기 보고서, 담당자 부재 시 중단 | 보고서 80%↓(2~3h→15m)·정합성 95% |
| 구매 | 사양·납기·품질·가격 분산, 경험 기반 BOM | 검토공수 50%↓(10MD→5MD)·예측오차<10% |
| 해외영업 | 시장정보 산재, 경험 의존 수주 판단 | 분석시간 75%↓(8h→2h)·Top20 자동추천 |
| 안전환경 | 수기 위험성평가, 주관적 빈도×강도 편차 | 작성 50%↓(2h→1h)·오류 50%↓ |
| 연구소 | 유량-차압 곡선 수기 추출, 육안 검수 | 작업 80%↓(10m→2m)·일치율 95% |
[출처: RFP slide3~7 · task-requirements.md]
3. 제안 범위와 목표
본 제안은 5개 과제 전체를 통합 제안합니다. 범위는 4개 층위로 구성됩니다.
- (A) 공통 AI 플랫폼 — 문서파싱(IDP)·RAG 검색·LLM 요약/생성·대시보드·표준DB·권한/감사. 5개 과제가 공유하는 토대로, 한 번 구축해 5개에 재사용 → 기간 내 완수의 기술적 열쇠.
- (B) 과제별 AI 앱 5종 — 공통 플랫폼 위에 부서별 로직(품질통계·BOM·수주랭킹·위험평가·곡선추출)을 얹습니다.
- (C) 현업 바이브코딩 인에이블먼트 — 표준 개발 방법론·현업용 스킬·MCP 도구 패키지·레벨별 교육·부서 코치.
- (D) 완수 안전망 — 수행사의 AI 모델 연동·코드리뷰·품질/보안 관리·기술지원 [사실: RFP slide2 수행사 역할].
목표: ① 사업기간 내 5개 시스템 구축 완료 ② 부서별 KPI 달성(§8) ③ AI 리터러시 내재화 + 현업 AI 활용 전문가 양성 + 운영 자립.
4. 솔루션 아키텍처
5개 과제를 따로 만들면 일정·품질을 맞출 수 없습니다. 핵심은 "공통 플랫폼 + 과제별 앱" 레이어드 구조로, 공통 기능(파싱·검색·요약·대시보드)을 한 번 만들어 다섯 번 재사용하는 것입니다.
flowchart TB
subgraph U["현업 사용자 (5개 부서)"]
U1["품질"]:::dept
U2["구매"]:::dept
U3["해외영업"]:::dept
U4["안전환경"]:::dept
U5["연구소"]:::dept
end
subgraph APP["과제별 AI 앱 (현업이 바이브 코딩으로 개발)"]
A1["품질통계·이상탐지"]
A2["구매 BOM·예측"]
A3["수주 Opportunity Radar"]
A4["위험성평가 어시스턴트"]
A5["Parts Spec 곡선추출"]
end
subgraph PLAT["공통 AI 플랫폼 (수행사 선구축·재사용)"]
P1["문서파싱 IDP"]
P2["RAG 검색·벡터DB"]
P3["LLM 요약·생성"]
P4["대시보드·알림"]
P5["표준DB·권한/감사"]
end
subgraph INFRA["인프라 (GB10 온프레미스 · VPN)"]
I1["GB10 온프레미스 LLM"]
I2["사내 시스템 연동 QDMS·구매DB·SOP"]
end
U --> APP --> PLAT --> INFRA
classDef dept fill:#e8f0fe,stroke:#4285f4;
- 데이터 흐름: 사내 데이터·문서·이미지·법령 → 공통 플랫폼(수집·파싱·RAG·LLM) → 과제별 앱 로직 → 보고서·추천·알림·DB 출력 [가정/제안].
- 공통 자산 재사용: 문서파싱·RAG·요약·대시보드·표준DB는 5개 과제에 공통 [사실: task-requirements.md 공통성 매트릭스] → 개발량·일정·품질 리스크 동시 절감.
- 인터페이스 계약(회귀 방지): 공통 플랫폼(P1~P5)은 과제별 앱에 버전이 고정된 API·데이터 스키마로 제공합니다. M0 선구축 단계에서 인터페이스 계약을 동결(freeze)해, 이후 플랫폼 변경이 5개 앱에 동시 회귀를 일으키지 않도록 합니다. 재사용률이 낮은 과제3(외부수집·NER)·과제5(차트 CV)는 공통 플랫폼 위 독립 파이프라인으로 분리해 일정 산정에 별도 반영합니다 [제안].
- 성숙도 근거: RAG·IDP·이상탐지·시장인텔리전스는 상용화 단계(TRL 8~9) [사실: task-tech-feasibility.md]. 새로 발명하는 기술이 아니라 검증된 컴포넌트의 조립.
5. ★ 현업 실행 방법론 (RFP 필수 ①)
평가 질문: "코딩 경험이 없는 현업이 정말 직접 만들 수 있는가? 결국 수행사가 다 만드는 것 아닌가?"
답: 표준화된 바이브 코딩 사이클 + 현업용 스킬·MCP 도구 + 부서 코치로, 현업이 '의도'를 말하면 AI가 코드를 만들고 수행사가 안전망을 댑니다.
5.1 표준 바이브 코딩 사이클
현업 담당자(부서당 1명)는 아래 5단계 사이클을 반복합니다. 개발자의 역할이 '타이핑'에서 'AI에게 의도를 전달하고 결과를 검증'으로 바뀝니다 [사실: 바이브코딩 정의, Wikipedia].
flowchart LR
S1["① 과제정의서<br/>현업이 업무·데이터·산출 정의"] --> S2["② 바이브 코딩<br/>AI 코딩에이전트에 자연어로 의도 전달"]
S2 --> S3["③ 코드리뷰·보안 게이트<br/>수행사가 품질·보안 검증"]
S3 --> S4["④ UAT<br/>현업이 실제 업무로 검증"]
S4 --> S5["⑤ 배포·회고<br/>재사용 컴포넌트 축적"]
S5 -.개선 반복.-> S2
S3 -.반려·보완.-> S2
| 단계 | 현업(주체) | 수행사(안전망) | 산출 |
|---|---|---|---|
| ① 과제정의서 | 업무·데이터·기대산출 기술 | 템플릿·예시 제공, 코칭 | 과제정의서 |
| ② 바이브 코딩 | AI에 자연어로 기능 요청·반복 | 페어개발, 막힘 해소 | 동작 코드 |
| ③ 코드리뷰·보안 | 리뷰 피드백 반영 | 코드리뷰·보안 게이트 책임 | 검증 코드 |
| ④ UAT | 실제 업무로 검증·피드백 | 결함 수정 지원 | UAT 결과 |
| ⑤ 배포·회고 | 운영·개선 아이디어 | 재사용 컴포넌트화 | 배포본·자산 |
5.2 "현업이 정말 만든다"를 가능케 하는 3대 장치
- 현업용 스킬·MCP 도구 패키지(핵심 차별화) — 단순 문서 템플릿을 넘어, 현업이 자연어로 호출하는 실행 가능한 도구를 제공합니다. ① 사내 시스템(QDMS·구매DB·SOP·법령DB)을 안전하게 연결하는 MCP 서버로, 현업이 연동·인증 코드를 직접 짜지 않고도 자연어로 데이터를 불러 씁니다. ② 과제정의서·프롬프트 패턴·검증 체크리스트·재사용 컴포넌트를 부서별 바이브코딩 스킬로 패키지화해 백지에서 시작하지 않게 합니다. 현업은 '무엇을'에 집중하고 '어떻게'의 위험은 도구가 흡수하며, 이 자산은 종료 후에도 사내에 남아 신규 과제에 재사용됩니다(§7 이관).
- 부서별 코치(페어개발) — 수행사 코치가 부서에 1:1로 붙어 초기엔 페어로, 점차 현업 단독으로 전환합니다. METR/McKinsey가 경고한 '비숙련자 생산성 저하'를 코칭으로 상쇄 사실 S4.
- 코드리뷰·보안 게이트 — 현업이 만든 코드는 반드시 수행사 리뷰·보안 검증을 통과해야 배포됩니다 [사실: RFP slide2 수행사 역할]. AI 생성 코드의 품질·보안 리스크를 구조적으로 차단.
MCP·도구 보안 원칙 [제안]: 현업이 자연어로 사내 시스템에 접근한다는 것은 곧 접근 통제가 도구에 내장되어야 함을 뜻합니다. 따라서 MCP 서버·스킬은 ① 읽기전용 기본(쓰기·삭제는 별도 승인) ② 과제별 최소권한 스코프(부서·데이터 범위 한정) ③ 접근 대상 화이트리스트 ④ 전 호출 감사 로그 ⑤ 프롬프트 인젝션·과접근 가드를 표준 적용합니다. 온프레미스(§11)와 결합해 "자연어 접근의 편의"와 "민감 시스템의 안전"을 동시에 보장합니다.
정직한 경계: 모든 과제를 100% 현업이 만들지는 않습니다. 복잡한 사내 시스템 연동·보안 모듈은 수행사가 담당하고, 업무 로직·화면·리포트 등 현업이 가장 잘 아는 영역을 현업이 만듭니다. 이 역할 경계가 곧 완수와 내재화를 동시에 달성하는 현실적 해법입니다.
5.3 현업 공수 모델 — "본업과 어떻게 양립하는가"
"현업이 직접 만든다"가 구호에 그치지 않도록, 투입 공수를 명시합니다.
- 현업 담당자: 부서당 1명이 주 약 8시간(주 1일 상당)을 과제에 전담 투입하는 것을 전제로 합니다 가정. 이를 위해 발주사와 전담시간 보장 + 부서장 KPI 반영을 합의 사항으로 제안합니다(R1 대응). 본업과의 충돌은 전담시간 블록으로 분리.
- 수행사 운영모델(상주+비상주 분리): 주 1회 상주일에는 현업 대면 교육·페어 가이드·요구사항 수집·코드리뷰를 집중하고, 비상주(주 4일 재택)에는 5개 과제 공통 자산(데이터 수집 파이프라인·문서파싱·RAG·표준DB)을 직접 개발합니다 [제안]. 특히 착수 첫 달(M0)은 현업 바이브코딩 교육·가이드·요구사항 수집에 집중하고, 이후 비상주일에 공통 플랫폼을 구축해 1인 상주 구조에서도 '현업 인에이블먼트'와 '공통부분 완수'를 시간 분리로 양립시킵니다. 초기엔 코치 주도, 후반엔 현업 단독으로 비중을 전환합니다.
과제별 "현업 개발 : 수행사 개발" 비중(난이도에 따른 정직한 배분 [제안]):
| 과제 | 현업 개발 영역 | 수행사 개발 영역 | 현업 비중(목표) |
|---|---|---|---|
| 1 품질 | 통계 정의·리포트 양식·대시보드 구성 | QDMS 연동·RAG 파이프라인·이상탐지 | 약 50% |
| 2 구매 | 분류 기준·BOM 규칙·화면 | IDP 파싱엔진·예측모델 | 약 40% |
| 3 해외영업 | 신호 정의·리포트·우선순위 기준 | 외부수집·NER·랭킹 파이프라인 | 약 30% |
| 4 안전환경 | SOP 매핑·체크리스트·서명 플로우 | 법령 RAG·KRAS 룰엔진 | 약 35% |
| 5 연구소 | 검수 기준·DB 스키마·추천 규칙 | 차트 디지타이징 CV·자동검수 | 약 30% |
즉 "현업이 만든다"는 업무를 가장 잘 아는 영역(정의·규칙·화면·검증)을 현업이 주도한다는 의미이며, AI 본체·연동·보안은 수행사가 책임집니다. 비중은 사업 후반으로 갈수록 현업 쪽으로 이동하여 내재화를 완성합니다.
5.4 ★ 지식 이식 방법론 — AX의 본질은 "도메인 지식을 시스템에 옮기는 것"
5개 과제의 현업은 그 업무의 유일한 지식 보유자입니다(품질의 "이 데이터는 이상하다"는 감, 안전의 현장 위험 직관, 구매의 대체품 경험칙). AI는 이식된 도메인 지식만큼만 똑똑합니다 — 일반 LLM은 원익의 업무를 모릅니다. 그래서 본 사업의 진짜 작업은 '코딩'이 아니라 현업의 암묵지를 시스템에 이식하는 것이고, 바이브 코딩 사이클(§5.1)이 곧 그 이식 절차입니다.
정직한 전제 — '추출'이 아니라 '점진 외재화' [제안]: 전문가는 자기 판단을 다 말로 못 합니다(숙련은 판단을 무의식으로 압축 — Polanyi). "뇌를 복사한다"는 약속 대신, 지식을 세 층으로 나눠 다룹니다(Collins): 관계적(안 적힌 구전·워크어라운드 → 완전 인코딩) / 신체적("감" → 모범 사례로 스캐폴딩) / 집단적(맥락 판단 → 사람을 검수 루프에).
이식 절차(5단계 · 일정 정합) [제안]:
- 선별·안전망(M0) — 과제 선정 3조건(관할 명확·핵심성·수행 동질성 — Stanford)으로 첫 파일럿 선정 + 비대체 보증(대체 두려움은 최고 지식의 은닉을 부름, 약 1/3 사실 Adaptavist).
- 외재화(M0~M1) — 코치 주도 결정추적(실제 사례 앞에서 "왜 그렇게 판단했나·언제 SOP가 깨지나" — CTA/CDM). 공식 SOP가 아니라 실제 작동방식(워크어라운드·아차사고)을 캡처합니다(Brown & Duguid) — SOP만 인코딩하면 틀린 걸 인코딩합니다.
- 인코딩(M1~M2) — 산출물 = 지식 그릇: 과제정의서=업무모델 / 시스템 프롬프트=결정기준(우선순위·트레이드오프·에스컬레이션) / RAG=문서·사례 / golden=베테랑 모범 케이스 / 검증 rubric=전문가의 "이건 틀렸다" 품질기준. 스킬·MCP(§5.2)가 이 그릇을 제공합니다.
- 검증 = 이식 게이트(M2) — 전문가의 품질판단을 rubric으로 자동화해 회귀 테스트화합니다(전문가 지식은 프롬프트가 아니라 채점 기준에 삽니다 — Anthropic). 코드리뷰·보안 게이트(§5.2)와 결합.
- 체화·나선(M3~운영) — 현업이 실업무에서 AI 출력을 교정하면 그것이 golden·eval로 승격되어 다음 사이클에 반영됩니다(한 번 캡처는 노화 — 나선이 돌아야 지속 SECI). AI 활용 전문가(§7)가 이 루프의 운영 주체입니다.
이 방법론이 두 가지를 동시에 풉니다 [제안]: ① 참여 동기 — 현업을 '코딩 배우는 학생'이 아니라 '지식을 이식하는 권위자'로 세우고, 그들의 #1 고통인 속인화·업무 연속성을 정면 해결합니다(내 지식이 시스템에 남으면 "담당자 부재 시 중단"에서 해방). ② '사내에 남는 역량'의 실체 — 시스템 프롬프트·KB·golden·rubric을 사내 소유·포터블 형식(저장소·표준 포맷·MCP)으로 두어, 벤더가 바뀌어도 지식 자산이 사내에 남습니다.
왜 결정적인가: 내부 구축 AI는 외부 조달보다 성과 도달률이 2배 낮습니다(사실 MIT NANDA). 그 격차를 가르는 변수가 '도메인 전문가와 AI를 잇는 번역'의 제도화 — 즉 코치(§5.2)입니다. 본 방법론은 그 코치 역할을 지식 이식 절차로 구조화한 것입니다.
6. ★ 완수 전략 (RFP 필수 ②)
평가 질문: "사업기간이 짧은데 5개를 어떻게 동시에 끝내는가? 실패하면?"
답: 공통 플랫폼 선구축 → 과제별 MVP 우선 → 단계 실증 → 리스크 레지스터로, 'PoC에서 끝나는 AI'가 되지 않게 관리합니다.
6.1 완수가 핵심인 이유 (데이터)
AI 프로젝트는 80% 이상이 실패하며(비AI IT의 약 2배 사실 RAND 2024), 기업 GenAI 파일럿의 약 95%가 손익 성과에 도달하지 못하고(사실 MIT NANDA 2025, "P&L 미달"), 생성형 AI 프로젝트의 30%+가 PoC 이후 폐기됩니다(사실 Gartner 2024). 도입률은 88%지만 유의미한 성과를 낸 기업은 6%뿐입니다(사실 McKinsey 2025). 실패 원인은 한결같이 기술이 아니라 워크플로우·조직·데이터·완수 역량입니다. 본 제안의 완수 전략은 바로 이 격차를 메웁니다.
6.2 단계별 일정 (착수일 기준 역산)
착수 2026-07-01·사업종료 2026-10-30이 확정 [사실: 발주사 협의·RFP slide2]입니다. 제안사는 구축 완료 목표를 10-25로 잡아 종료 전 5일을 안정화·이관 버퍼로 둡니다. 가용기간은 약 16주로, §6.5의 '5개 전체 동시'(12주 이상) 기준 시나리오에 해당합니다.
gantt
title 추진 일정 (착수 2026-07-01 확정 · 구축완료 10-25 · 사업종료 10-30)
dateFormat YYYY-MM-DD
axisFormat %m/%d
section 공통 플랫폼(수행사 직접·비상주일)
환경(GB10·VPN)·킥오프 :m0a, 2026-07-01, 14d
공통 데이터 파이프라인·플랫폼 골격 :m0b, 2026-07-14, 28d
section 현업 과제 개발(병렬)
교육1차+과제정의서 워크숍(5부서) :m1a, 2026-07-07, 18d
5개 MVP 스프린트(현업 바이브코딩) :m1b, 2026-08-03, 26d
기능확장 + 코드리뷰·보안 :m2a, 2026-08-31, 26d
중간 UAT :m2b, 2026-09-21, 12d
section 안정화·이관
최종 UAT·안정화 :m3a, 2026-10-01, 17d
교육 2차·운영 이관·완료보고 :m3b, 2026-10-13, 12d
section 도구·교육(전구간)
현업용 스킬·MCP 패키지 제공·고도화 :tool, 2026-07-14, 90d
레벨별 교육 + AI 활용 전문가 양성 :edu, 2026-07-07, 110d
| 구간 | 핵심 활동 | 산출 |
|---|---|---|
| M0 (7/1~7/31) | 환경 셋업, 현업 교육 1차, 과제정의서 워크숍(요구사항 수집), 공통 데이터 파이프라인 착수(수행사 직접) | 과제정의서 5종, 플랫폼 골격, 스킬·MCP α |
| M1 (8월) | 현업 바이브코딩 MVP 스프린트 + 스킬·MCP 1차 배포 | 5개 MVP |
| M2 (9월) | 기능 확장 + 코드리뷰·보안 게이트 + 중간 UAT | 베타 5종 |
| M3 (10/1~10/25) | 최종 UAT·안정화·운영 이관·교육 2차·완료보고 (사업종료 10/30 전 5일 버퍼) | 운영판 5종, 이관 완료 |
6.3 완수 4대 원칙
- 공통 플랫폼 선구축 — 5개의 공통 기능을 먼저 만들어 과제별 개발량을 최소화.
- MVP 우선 — 각 과제를 한 번에 완성하지 않고, KPI에 직결되는 최소 기능부터 동작시켜 조기 실증.
- 데이터 정형도 기준 우선순위 — 데이터가 잘 정리된 과제(품질·Parts Spec)를 먼저 성공시켜 사내 확산 동력 확보 가정.
- 범위 조정 룰 — 일정 리스크 발생 시 '있으면 좋은 기능'을 후순위로 내리는 사전 합의된 룰로 완수 자체를 보호.
6.4 리스크 레지스터
| ID | 리스크 | 대응 |
|---|---|---|
| R1 | 현업 코딩 역량 부족 → 수행사 단독개발로 변질 | 현업용 스킬·MCP 도구 + 부서 코치 + 페어개발 |
| R2 | 기간 내 5개 동시 완수 실패 | 공통 플랫폼 + MVP 우선 + 범위 조정 룰 |
| R3 | 사내 시스템(QDMS·구매DB) 연동 지연 | CFO-IT 협업 선행, 인터페이스 조기 확정 |
| R4 | 과제3 외부데이터 라이선스·저작권 | 허용 출처 한정(DART 공시 우선)·수집정책 명문화 |
| R5 | 과제4 법령 정확성(환각 17~33% 사실 Stanford 2024) | 법령 RAG 출처표기 + 전문가 검수 게이트 + 사람 확정 |
| R6 | GB10 온프레미스 성능/보안 트레이드오프 | 온프레미스 sLLM + 민감도별 처리 분리 |
| R7 | 종료 후 운영 단절 | AI 활용 전문가 양성 + 문서화 + 완전 이관(§7) |
6.5 기간·범위 연동 (계약 트리거 — 일정 리스크 대비)
착수 2026-07-01 확정으로 가용기간은 약 16주이며, 이는 아래 표의 '12주 이상 = 5개 전체 동시'(기준 시나리오)에 해당합니다. 다만 사내 시스템 연동 지연 등 만일의 일정 리스크에 대비해, 가용기간이 줄면 수행사 재량이 아닌 사전 합의된 객관적 규칙으로 범위를 조정합니다. 이로써 "완수 약속"과 "현실적 일정"을 동시에 지킵니다.
| 착수일 기준 가용기간 | 동시 구축 범위 | 비고 |
|---|---|---|
| 12주 이상 | 5개 과제 전체 동시 | 기준 시나리오 |
| 9~11주 | 5개 전체(공통 플랫폼 + 핵심 KPI 기능 우선, 부가기능 후순위) | MVP 범위로 5개 완수 |
| 6~8주 | 3개 우선 완수(데이터 정형도 높은 과제1·2·5) + 2개 설계·PoC | 발주사 협의로 우선순위 확정 |
| 6주 미만 | 1~2개 집중 완수 + 나머지 로드맵 제시 | 차기 단계 연계 |
우선순위(과제 선택)는 착수 시점에 발주사와 1회 확정합니다. 이 표는 "완수 못 할 수 있다"는 회피가 아니라, 어떤 조건에서도 '완수된 결과물'을 보장하기 위한 객관적 안전장치입니다.
6.6 실적 공백 대응 — 1과제 선행 파일럿 (단계 계약 게이트 제안)
제안사의 유사 구축 실적은 별도 제출하나 [확인 필요 — §12], 발주사의 리스크를 구조적으로 최소화하기 위해 "1과제 선행 파일럿 → 성공기준 충족 시 잔여 과제 확대"의 단계 계약 게이트를 제안합니다 [제안]. 단순 옵션이 아니라, "검증되지 않은 1인 신생사"라는 우려를 발주사가 최소 리스크로 검증할 수 있는 장치입니다.
| 단계 | 내용 | 게이트(확대 조건) |
|---|---|---|
| 1. 선행 파일럿(약 4~6주) | 데이터 정형도가 높아 빠른 성공이 가능한 과제 1개(예: 과제1 품질 또는 과제5 Parts Spec)를 짧게 구축·실증 | — |
| 2. 검증 | 착수 시 발주사와 사전 합의한 성공기준(예: 핵심 KPI 목표치 도달·현업 단독 개발 성립·코드리뷰 통과율)을 파일럿 결과로 확인 | 성공기준 충족 → 잔여 과제 자동 확대 / 미달 → 범위·일정·방법 재협의 |
| 3. 확대 | §6.5의 가용기간-범위 연동 규칙에 따라 잔여 과제를 순차/동시 전개 | — |
이 구조는 §6.5(기간-범위 연동)와 결합하여, 발주사가 "선(先)검증 후(後)확대"로 리스크를 통제하면서도 전체 일정을 유지하게 합니다. 파일럿 성공기준·확대 트리거의 구체 수치는 착수 시 1회 합의합니다 [확인 필요 — 발주사].
7. ★ AI 리터러시 내재화 — 교육 체계 (RFP 필수 ③)
평가 질문: "교육이 일회성으로 끝나지 않고 역량이 사내에 남는가?"
답: 레벨별 커리큘럼 + 핸즈온 + 현업 AI 활용 전문가 양성 + 완전 이관으로, 사업이 끝나면 사내가 스스로 운영·고도화합니다.
flowchart TB
L1["Level 1 · 전 임직원<br/>AI 리터러시·분별력<br/>(AI 이해·윤리·한계)"] --> L2["Level 2 · 현업 담당자<br/>바이브 코딩 실무<br/>(과제정의·프롬프트·UAT)"]
L2 --> L3["Level 3 · AI 활용 전문가<br/>운영·코칭·고도화<br/>(부서별 1~2명)"]
L3 --> OWN["운영 완전 이관<br/>AI 활용 전문가 자체 운영"]
style OWN fill:#e6f4ea,stroke:#34a853
| 레벨 | 대상 | 내용 | 목표 |
|---|---|---|---|
| L1 리터러시 | 전 임직원 | AI 이해·활용·분별력(한계·환각·보안) | RFP "이해하고 잘 다루며 분별력" [사실 slide2] |
| L2 실무 | 현업 담당자 | 과제정의서·바이브코딩·코드리뷰 대응·UAT (핸즈온) | 직접 개발 수행 |
| L3 · AI 활용 전문가 | 부서별 1~2명 | 운영·코칭·고도화·신규과제 전개 | 자립 운영 주체 |
왜 이 구조인가: AI 도입의 성패는 도구가 아니라 사람·워크플로우입니다(도입 88% vs 성과 6% 사실 McKinsey). 특히 저숙련자의 생산성은 교육·가드레일이 있을 때 오히려 +34%까지 향상됩니다(사실 NBER 2023, 고객지원 저숙련 +34%) — 교육이 역량 격차를 평준화합니다. 현업 AI 활용 전문가가 양성되면 종료 후에도 운영·고도화가 지속되어, '구축하고 방치되는 시스템'을 방지합니다.
운영 이관(완전 이관): 사업 종료 시 운영 권한·문서·재사용 자산을 현업 AI 활용 전문가에게 완전 이관합니다 [가정/목표]. 이관 기준(운영 매뉴얼, 장애 대응 절차, AI 활용 전문가 역량 체크리스트)을 충족해야 종료로 간주합니다.
이관이 '방치'가 되지 않게 — 사후 지속성 장치 [제안]:
| 항목 | 내용 |
|---|---|
| 하자보수 | 종료 후 일정 기간(예: 3개월) 무상 하자보수 + 원격 코칭(SLA 협의) |
| AI 활용 전문가 백업 | 부서별 AI 활용 전문가 1~2명 복수 양성, 이탈 시 백업 인력 즉시 가동 |
| 운영비 주체 | GB10·온프레미스 LLM의 유지보수·모델 업데이트·라이선스 부담 주체를 계약 시 명문화 [확인 필요 — 발주사 협의] |
| 지식 자산 | 과제정의서·프롬프트·재사용 컴포넌트·운영 매뉴얼을 사내 저장소에 귀속 |
운영 자립은 "양성하면 알아서 된다"는 낙관이 아니라, 백업 인력·하자보수·운영비 주체를 계약으로 닫을 때 완성됩니다.
8. 5개 과제별 TO-BE 설계와 KPI
각 과제는 공통 플랫폼 위에서 현업이 개발하며, KPI는 측정 설계와 함께 정의합니다. 정확도·일치율 목표는 입력 품질에 따라 변동하므로, 사람 검수와 PoC 자체측정을 전제로 정직하게 제시합니다 [사실: task-tech-feasibility.md].
8.0 KPI 측정 프로토콜 (지표 정의 명문화)
"95%"가 무엇을 재는지 모호하면 평가도 검증도 불가합니다. 각 KPI의 측정 지표·검수 공수 포함 여부·입력 품질 구간별 기대치를 사전 정의합니다.
| KPI | 측정 지표 정의 | 검수 공수 | 양호 입력 | 저품질 입력 |
|---|---|---|---|---|
| 정합성 95%(과제1) | QDMS 원시값 대비 산출 통계 일치율(표본 대조) | 자동 | 95% 목표 | 데이터 결측 시 하락 |
| 검색 정확도 95%(과제1) | RAG 답변의 출처 근거 정확도(answer correctness, 사람 평가 표본) ≠ recall@k | 사람 표본검증 | 95% 목표 | 문서 부재 시 하락 |
| 추출 정확도(과제2) | IDP 필드/표 추출 정확도(정답 대비) | 신뢰도 기반 HITL | 표 82~87% | 복잡표 하락 |
| 예측오차<10%(과제2) | BOM 물량·납기 예측 모델 MAPE — 추출 정확도와 별개 지표. PoC로 베이스라인 측정 후 확정 | 별도 모델 | PoC 확정 | 이력 부족 시 보류 |
| 유관부서 활용도 70%↑(과제2) | 시스템 사용 유관부서 인원수 ÷ 대상 인원(착수 베이스라인 대비) | 로그 집계 | 70% 목표 | 도입 초기 낮음→확산 |
| 일치율 95%(과제5) | 추출 곡선 vs 원본 추세선 형상 일치(RMSE 기반) | 사람 검수 병행 | 단일곡선 95%+ | 중첩·저해상 ~88% |
| 시간 80%↓ 등 | (현 업무시간 − 도입후) ÷ 현 업무시간 — 현 업무량 베이스라인 측정 선행 필요 | — | 목표 | 베이스라인 확인 필요 |
솔직한 한계: 시간 단축 KPI(80%↓ 등)는 현재 업무량 베이스라인 데이터가 있어야 검증됩니다(§13). 착수 직후 5개 부서 현 업무량을 실측해 베이스라인을 확정합니다.
과제 1 · AI 품질통계 검색 시스템 (품질)
- AS-IS 통증: QDMS 데이터 수동 가공 → 수기 보고서(건당 2~3h), 담당자 부재 시 중단(속인화). 작업은 ⓐ반복 통계 산출 ⓑ"이상" 판단 ⓒ보고 서술로 갈리며 암묵지는 ⓑ·ⓒ에 있습니다.
- TO-BE: QDMS 자동 동기화 → 통계 자동 산출 → LLM 해석/요약 → RAG 문서검색 → 이상징후 알림 → 표준 보고서 자동 생성 [사실: slide3].
- 공통 자산 재사용: RAG 파이프라인·대시보드·표준DB·온프레미스 LLM·지식 이식 절차(§5.4)를 그대로 조립 — 특화 개발 비중이 가장 작은 과제(공통 선구축 효과 최대).
- 기술(특화): RAG(품질문서, hybrid 검색 + 출처 링크) + LLM + 이상탐지 2단계 — ① 검증된 SPC(3σ·EWMA·관리도) 즉시 적용(설명가능·신뢰) ② 비지도 ML(Isolation Forest 등) 보강(다변량·미세 패턴) [사실: 기술타당성]. 전용 클라우드 이상탐지 단종 추세 → OSS 자체구현(온프레미스·설명가능성 부합).
- ★ 지식 이식 포인트(§5.4): (신체적) "SPC 범위 내인데 추세가 불길"한 이상 감 → 실 QDMS think-aloud + 아차 불량 케이스 결정추적 → 이상 판단 rubric(베테랑 판정 케이스를 등급 anchor). (관계적) 보고 판단 → 모범 보고서 역추출 → golden 3~5건 + 프롬프트 결정기준. 운영 중 오탐/미탐 교정 → eval 승격(나선).
- KPI: 보고서 80%↓(2~3h→15m), 정합성 95%, 검색 정확도 95%. RAG 답변은 출처 링크 + 사람 검증 전제(측정 정의 §8.0).
- 리스크·비중·MVP: 오탐 경보피로(→SPC 우선·임계 튜닝·HITL) · RAG 환각(→출처·검증) · QDMS 데이터 품질(→정합성 입력 의존). 현업:수행사 ≈50%(현업=통계 정의·리포트 양식·이상 판단 기준 / 수행사=연동·RAG·이상탐지 엔진). MVP=1개 제품군 불량률 + 표준 보고서 1종 + 기본 SPC 알림 → 다제품·다변량 확장. 정형도·즉시 성과로 선행 파일럿 1순위 후보(§6.6).
- RFP 핵심기능 충족(slide3): QDMS 자동로드·동기화 ✓ / 유형·업체별 불량률 통계 자동산출 ✓ / LLM 해석·요약 ✓ / RAG 품질문서 검색 ✓ / 이상징후 감지·알림 ✓ / 표준 템플릿 자동생성 ✓ / 자연어 질의 검색 ✓
과제 2 · 통합데이터 AI 구매관리 (구매)
- AS-IS 통증: 사양·납기·품질·가격이 다종 문서(Word/Excel/PPT/스캔 PDF)에 분산, BOM은 경험 기반 수작업(검토 10MD/건), 대체품 판단은 베테랑 경험칙(속인화). 입력이 비정형 문서라 파싱이 1차 관문.
- TO-BE: 멀티포맷 문서 자동 파싱 → 카테고리 자동 분류 → BOM 최적화·대체품 추천 → 물량배분·품질/납기 예측 [사실: slide4].
- 공통 자산 재사용 + 특화: 문서파싱·RAG·표준DB·온프레미스 LLM·지식 이식 절차 공유. 단 IDP 특화 비중이 가장 큰 축(다포맷 파싱이 본체).
- 기술(특화): IDP 포맷별 분기 — Word/Excel/PPT 네이티브 파싱(고정확)·스캔 PDF만 OCR(정확도·비용 양득). 표 추출 현실 정확도 Azure DI 87%·Textract 82%(사실 S22, 유형별 40~99% 편차) → 신뢰도 기반 HITL(저신뢰 필드만 사람). 자사 실문서 PoC 자체측정 필수.
- ★ 차세대 비주얼 검색(옵션 · PoC 게이트) [제안]: 사양서·견적서가 스캔 PDF·복잡표로 들어오면 텍스트 추출 단계에서 표·레이아웃 정보를 잃습니다(위 표 추출 정확도 하락과 동일 원인). 이를 보완하기 위해 픽셀 네이티브 비주얼 RAG — 문서를 스크린샷째 임베딩·검색하는 방식(예: PixelRAG — Berkeley, Apache-2.0, github.com/StarTrail-org/PixelRAG) — 을 '통합 구매DB 검색·질의' 기능에 선택적으로 검토합니다. 표·차트를 이미지째 검색해 텍스트 RAG가 평탄화하며 놓치는 레이아웃을 보존합니다(자체 보고 +18% 정확도, SimpleQA). 단 ① v0.3.0 신생 기술(2026.06 공개) ② 한국어 문서 미검증(LoRA가 영문 스크린샷 학습) ③ 온프레미스 VLM(Qwen3-VL-Embedding-2B 등) 부하 미확정 → 자사 한국어 문서 PoC로 효과·부하를 확인한 뒤에만 채택하고, 기본 추출 파이프라인은 IDP를 유지합니다. 구조화 추출(BOM·물량·예측)은 비주얼 RAG로 대체 불가하므로 검색/질의 보강에 한정 [가정 → PoC 실측].
- ★ 분석·최적화 엔진(RFP ③④⑤ 실체) [제안]: ① BOM 최적화·대체품 추천(위 지식 이식) ② 물량배분 최적화 — 공급사별 능력(생산능력·납기·품질·단가)과 리스크 분산(단일 공급 의존 회피)을 제약으로 한 최적 배분(제약 기반 최적화: 선형계획/휴리스틱, 규칙 + 사람 확정) ③ 품질·납기 예측모델(과거 이력 MAPE, 추출 정확도와 별개 — §8.0). 모든 추천은 근거 데이터 병기, 최종 확정은 사람.
- ★ 지식 이식 포인트(§5.4): (관계적) 대체품 선정 경험칙("이건 저것으로 대체 가능, 단 이 조건일 때만") → output archaeology(과거 좋은 대체 결정 역추출) + "언제 안 되나?" 결정추적 → 대체 매핑 결정표 + gold(베테랑 결정 사례). (판단) BOM 가중(품질×납기×가격) → 프롬프트 TRADE-OFF 층 + rubric. ★ 대체품 오추천 = 품질·납기 리스크 → 추천은 AI, 확정은 사람(사람 확정 게이트).
- KPI: 검토공수 50%↓(10MD→5MD), 유관부서 활용 70%↑. 예측오차<10%는 IDP 추출 정확도가 아니라 BOM 물량·납기 예측모델의 별도 지표로, PoC 베이스라인 측정 후 확정(§8.0). (조달 AI 생산성 25~40%↑ 사실 McKinsey)
- 리스크·비중·MVP: IDP 복잡표 정확도 하락(→HITL·PoC) · 대체품 오추천(→사람 확정) · 예측 이력부족(→단계 도입). 현업:수행사 ≈40%(현업=분류 기준·BOM 규칙·화면 / 수행사=IDP 파싱엔진·예측모델). MVP=1개 카테고리 파싱+분류+구매DB 검색 → BOM·대체품·예측 확장. 파일럿보다 후속 단계 적합(↔ 과제1은 1순위).
- RFP 핵심기능 충족(slide4): 다종문서 업로드·자동파싱 ✓ / 카테고리별 자동분류·취합 ✓ / BOM 최적화·대체품 추천 ✓ / 물량배분 최적화 ✓ / 품질·납기 예측모델 ✓ / 통합 구매DB·검색 ✓
과제 3 · 글로벌 반도체 수주전략 (해외영업)
- AS-IS 통증: 시장정보(뉴스·IR·Earnings Call) 산재, 경험 의존 수주 판단(분석 8h/건). "무엇이 유망 수주 신호인가"는 영업 베테랑의 감(속인화). 입력이 사외 데이터라 과제1·2와 성격이 다름.
- TO-BE: 뉴스·IR·Earnings Call 자동 수집·분석 → 유망고객 순위화 → Opportunity Radar Top20 → 경쟁사 Gap·Action 추천 [사실: slide5].
- 공통 자산 재사용 + 특화: 수집 파이프라인·RAG·요약·대시보드·온프레미스 LLM 공유. 특화 = 외부 수집 + NER + 랭킹 + 한국어 금융 NLP, 그리고 저작권·데이터 거버넌스가 과제3 고유 변수.
- 기술(특화): 수집(뉴스·IR·Earnings Call·EPC 리드·고객 CapEx 투자계획) + NER(기업·제품·이벤트) + 프로젝트 자동 분류 + 요약 + 랭킹(유망도 점수). 한국어 금융 NLP(KR-FinBert, DART 추가학습) [사실: 기술타당성]. 데이터 저작권 리스크(2025 AI저작권 소송 70건+) → 허용 출처 한정(DART 공시 우선)·전 신호 원문 링크·HITL. NER·랭킹 정확도는 출처 의존 → 사람 검증 표본 + 신뢰도 점수(과신 배제). 외부 수집은 온프레미스 경계 밖 → 별도 데이터 거버넌스 설계.
- ★ 수주 액션·부족역량 도출(RFP ④⑤ 실체) [제안]: 경쟁사 Gap을 '비교'에서 멈추지 않고 → 원익의 부족 역량·대응과제 도출(가격·납기·레퍼런스·기술스펙 차이) → Action Recommendation — 수주확률을 높이는 다음 액션을 근거와 함께 자동 제안(접촉 우선순위·제안 포인트·경쟁 대응·리스크). 랭킹은 "향후 3년" 투자 파이프라인(CapEx 사이클) 기반 forward-looking 축 포함. 전 액션 근거(데이터·원문) 링크, 최종 판단은 사람.
- ★ 지식 이식 포인트(§5.4): (판단) "유망 수주 신호" — 어떤 뉴스/IR가 실제 수주로 → 과거 성공·실패 수주 결정추적("어떤 신호 보고 움직였나·놓친 신호는?") → '유망 신호' 정의 = 룰/결정표 + 프롬프트 결정기준. (관계적) 우선순위 가중(고객 규모·관계·타이밍) → output archaeology → TRADE-OFF 층 + gold(베테랑 Top 케이스) + rubric. ★ 전 신호 원문 링크(환각·저작권 차단), 최종 판단은 사람(AI는 후보 제시).
- KPI: 분석시간 75%↓(8h→2h), Top20 자동추천(사람 검증), 고객별 경쟁사 비교.
- 저작권-커버리지 trade-off(정직): DART 공시 등 허용 출처로 한정하면 저작권 리스크는 낮아지나 신호 커버리지가 줄 수 있습니다. 이를 보완하기 위해 ① 라이선스 확보 유료 데이터(IR/뉴스) 단계적 추가 ② 한국어 금융 NLP(KR-FinBert)의 DART 추가학습 공수를 일정에 반영합니다 [제안].
- 리스크·비중·MVP: 저작권(→허용 출처·원문 링크·HITL) · NER/랭킹 정확도(→사람 검증·신뢰도) · 외부 데이터 거버넌스(→온프레미스 경계 설계). 현업:수행사 ≈30%(현업=신호 정의·리포트·우선순위 기준 / 수행사=외부수집·NER·랭킹) — 수행사 비중 최고. MVP=DART 공시 기반 수집+요약+기본 랭킹(저작권 안전) → 뉴스/IR 라이선스 확대·경쟁사 Gap. DART-only MVP는 안전하게 조기 실증 가능.
- RFP 핵심기능 충족(slide5): 시장뉴스·IR·Earnings Call 자동수집 ✓ / 유망고객 순위화 ✓ / 프로젝트 Top20 추천 ✓ / 경쟁사 Gap 분석 ✓ / Action Recommendation ✓ / Opportunity Radar 대시보드 ✓
과제 4 · 위험성평가 AI 어시스턴트 (안전환경)
- AS-IS 통증: 위험성평가 수기 작성(건당 2h), 빈도×강도 판단이 주관적·평가자별 편차. "규정엔 없지만 위험"한 현장 직관은 베테랑 머릿속(속인화). 중대재해법(2024.1.27 5인↑ 전면적용)으로 시급·고스테이크.
- TO-BE: SOP 기반 공정 자동분류 → 위험요인·강도 자동추천(KRAS DB) → 관련법률·개선대책 제시 → 근로자 전자서명 관리 [사실: slide6].
- 공통 자산 재사용 + 특화: 분류·RAG·표준DB·온프레미스 LLM·지식 이식 절차 공유. 특화 = SOP 분류 + 법령 RAG + KRAS 룰엔진(243). 법적 대체 불가 영역(사업주 책임·근로자 참여)이 과제4 고유.
- 기술(특화): 공정 분류 + 위험요인·강도 추천(KRAS) + 법령 RAG(조문 링크) + 전자서명. KRAS는 KOSHA 공식(243 소분류) [사실: 기술타당성]. 법령 RAG 환각 17~33%(사실 Stanford 2024) → 조문 링크 병기·전문가 검수 게이트 필수(환각=컴플라이언스 리스크). 사업주 책임·근로자 참여는 AI 대체 불가 → 워크플로우에 절차 강제 삽입을 차별점화.
- ★★ 지식 이식 포인트(§5.4 — 5개 중 가장 어려움): (신체적) 현장 위험 직관("규정 밖 위험") → 과거 사고·아차사고에 CDM → 빈도×강도 rubric(베테랑 평가 케이스를 등급 anchor) + gold(모범 평가서). (집단적) 위험성평가는 협의·근로자 참여가 본질 → 인코딩 불가, AI는 초안·확정과 서명은 사람. ★ §5.4 정직한 경계의 구현 = '절차 강제 삽입'. 전문가 검수 필수, 교정 → eval 승격.
- KPI: 작성 50%↓(2h→1h), 오류 50%↓. 컴플라이언스: 중대재해법·산안법 제36조 매핑 [사실: 법제처].
- 리스크·비중·MVP: 법령 환각(→조문 링크·전문가 게이트) · 주관적 강도 편차(→rubric 표준화) · 법적 대체불가 영역 오인(→절차 강제·사람 확정) · 고스테이크(중대재해 책임). 현업:수행사 ≈35%(현업=SOP 매핑·체크리스트·서명 플로우 / 수행사=법령 RAG·KRAS 룰엔진). MVP=1개 공정군 평가 초안(KRAS+법령 링크)+전자서명 → 다공정·개선대책 확장. 고스테이크라 신중하되 rubric·전문가 게이트로 통제, 법령 환각 PoC 검증 우선.
- RFP 핵심기능 충족(slide6): SOP 기반 공정 자동분류 ✓ / 위험성평가 DB 기반 위험요인·강도 추천 ✓ / KRAS 빈도·강도법 연동 ✓ / 관련법률·개선대책 제시 ✓ / 근로자 열람확인·전자서명 ✓ / 위험성평가 이력DB·검색 ✓
과제 5 · Parts Spec DB 구축 (연구소)
- AS-IS 통증: 유량-차압 곡선 수기 추출(곡선당 10m)·육안 검수. 200개+ 카탈로그 일괄 + 지속 수입으로 추출·검수가 노동집약. "이 추출이 원본과 맞나"의 검수 기준은 연구원 경험(속인화 — 단, 정답이 명확해 상대적으로 가벼움).
- TO-BE: 카탈로그 이미지 업로드 → OCR/이미지인식 → 유량-차압 곡선 이산화 자동추출 → 자동검수 → 표준DB → 최적 Part 추천 [사실: slide7].
- 공통 자산 재사용 + 특화: 표준DB·온프레미스·지식 이식 절차 공유. 특화 = 차트 디지타이징 CV — 5개 중 기술 스택이 가장 이질적(RAG·LLM 비중 낮고 이미지처리·CV 중심).
- 구축 물량(RFP 명시): 초기 대상은 Regulator·Line Filter 제품 카탈로그 약 200개 이상이며, 이후 신규 카탈로그가 지속 수입됩니다 [사실: slide7]. 카탈로그당 다수의 유량-차압 곡선이 포함되어 초기 200개+ 일괄 구축에 추출·검수 공수가 집중되므로, ① M1~M2에 고빈도 사용 Part부터 우선순위 배치 추출 → ② 반자동 디지타이징 + 사람 검수 병행으로 초기 표준DB 구축 → ③ 신규 카탈로그는 동일 파이프라인의 증분 등록 체계로 흡수합니다. 곡선당 처리시간(2분 목표)×물량으로 산정되는 초기 구축 공수는 착수 직후 표본 카탈로그로 실측해 일정에 반영합니다 [가정 → PoC 실측].
- 기술(특화): 차트 디지타이징(WebPlotDigitizer/Engauge 반자동 + LineFormer 보조). 95% 일치율은 양호한 입력·분리곡선 전제 — 저품질·중첩 곡선은 ~88%로 하락(사실 S23)하므로 사람 검수 병행 [사실: 기술타당성, 정직 framing].
- ★ 지식 이식 포인트(§5.4 — 5개 중 가장 가벼움): (신체+관계) 검수 기준("이 추출이 원본과 맞다/틀리다", 허용 편차) → 실 카탈로그 검수 think-aloud("왜 재추출? 어디가 틀렸나?") → 자동검수 rubric/룰(RMSE·형상 일치) + gold(연구원 검증 곡선). ★ 자동검수가 핵심 이식물(사람 검수 부담↓), 재검수 교정 → 자동검수 기준 개선(나선). 정답(원본 곡선)이 명확해 golden·eval 만들기 가장 쉬움(↔ 과제4 집단 암묵지와 대조).
- KPI: 작업 80%↓(10m→2m, 검수시간 포함 기준), 추세선 일치율 95%(양호 입력·검수 병행; 저품질·중첩곡선 ~88%, RMSE 기반). 차압 로그축 보정을 별도 처리.
- 리스크·비중·MVP: 저품질·중첩 곡선 정확도↓(→사람 검수·~88% 정직) · 200개+ 초기 물량 공수 집중(→고빈도 우선·증분 체계) · 로그축 보정 누락(→별도 처리). 현업:수행사 ≈30%(현업=검수 기준·DB 스키마·추천 규칙 / 수행사=차트 디지타이징 CV·자동검수). MVP=고빈도 Part 1종 추출+자동검수+표준DB → 200개+ 전체·최적 Part 추천 확장. 정답 명확·증분 체계로 구축 적합, 물량 커 공수 PoC 실측 선행.
- RFP 핵심기능 충족(slide7): 카탈로그 이미지 업로드·OCR/인식 ✓ / 유량-차압 곡선 이산화 자동추출 ✓ / 추출데이터-원본 자동검수 ✓ / Parts Spec 표준DB 구축 ✓ / 운용조건 기반 최적 Part 추천 ✓ / 추가 카탈로그 지속등록 ✓
9. 추진 체계와 역할 분담 (RACI)
RFP가 정의한 3주체 [사실: slide2]를 RACI로 구체화합니다. (R=실행, A=책임, C=자문, I=공유)
flowchart TB
PM["수행사 PM/아키텍트<br/>(완수 총괄)"]
subgraph 수행사["수행사 (외부 투입 · 안전망)"]
AE["AI 엔지니어<br/>모델연동·RAG·IDP"]
CO["바이브코딩 코치<br/>부서별 페어개발·교육"]
QS["품질/보안 리드<br/>코드리뷰·보안게이트"]
end
subgraph 발주사["발주사 (내부 지원)"]
IT["CFO-IT<br/>인프라·VPN·연동·접근권한"]
end
subgraph 현업["현업 (개발 주체)"]
D1["부서 담당자 ×5<br/>과제정의·개발·UAT"]
CH["AI 활용 전문가<br/>운영·고도화"]
end
PM --> AE & CO & QS
PM <--> IT
CO --> D1
D1 --> CH
| 활동 | 수행사 | CFO-IT | 현업 담당자 |
|---|---|---|---|
| 과제정의서 작성 | C | I | R/A |
| 바이브 코딩 개발 | C(코치) | I | R/A |
| AI 모델 연동·플랫폼 | R/A | C | I |
| 코드리뷰·보안 게이트 | R/A | C | I |
| 사내 시스템 연동·VPN·권한 | C | R/A | I |
| UAT | C | I | R/A |
| 교육·AI 활용 전문가 양성 | R/A | I | R(참여) |
| 운영 이관 | C | I | R/A |
[출처: RFP slide2 · business-core team 블록]
10. 품질·보안·위험 관리
flowchart LR
DEV["현업 개발 코드"] --> G1{"코드리뷰 게이트<br/>수행사"}
G1 -->|통과| G2{"보안 게이트<br/>취약점·권한·데이터"}
G1 -->|반려| DEV
G2 -->|통과| G3{"UAT 게이트<br/>현업 검증"}
G2 -->|반려| DEV
G3 -->|통과| REL["배포"]
G3 -->|반려| DEV
- 품질: 모든 현업 코드는 수행사 코드리뷰를 통과해야 배포. AI 생성 코드 품질 리스크를 게이트로 차단.
- 보안: GB10 온프레미스 LLM으로 민감 데이터의 외부 유출을 구조적으로 차단합니다. AI 미도입 기업의 최대 장벽이 '데이터 프라이버시(57%)'였음을 고려하면(사실 IBM 2023), 온프레미스는 도입 당위성의 핵심입니다. 민감도별 처리 분리 + 접근권한(ACL)·감사 로그. 특히 현업이 자연어로 사내 시스템에 접근하는 MCP 도구는 읽기전용 기본·최소권한·화이트리스트·전 호출 감사 로그·프롬프트 인젝션 가드를 적용합니다(§5.2).
- 위험 관리: §6.4 리스크 레지스터를 주기적으로 갱신, 게이트 통과율·KPI 달성률을 대시보드로 추적.
11. 환경·인프라 (GB10 온프레미스 · VPN 재택)
RFP는 수행인력 1인당 GB10을 지급하고 주 1일 방문 + 4일 재택(VPN)을 명시했습니다 [사실: slide2]. 이를 다음과 같이 활용합니다.
- GB10 = 책상 위 온프레미스 AI 워크스테이션: NVIDIA GB10(DGX Spark)은 128GB 통합 메모리·4TB 자체 암호화 SSD·표준 콘센트로, 별도 데이터센터 없이 사무실에 즉시 배치됩니다 사실 NVIDIA 2025. 사내 폐쇄망에서 민감 데이터를 로컬로 처리해, AI 도입의 최대 장벽인 데이터 프라이버시(57% 사실 IBM 2023)를 구조적으로 해소합니다.
- 성능에 대한 정직한 설계(과장 배제): NVIDIA 스펙상 단일 장비 200B 추론·2대 405B가 가능하나 사실 NVIDIA, 이는 이론적 상한이며 다중 동시 요청·실시간 응답은 별개의 문제입니다. 따라서 실운용 모델은 20~70B급 양자화 sLLM을 기본으로 하고, 동시 사용자·RAG 인덱스 규모·응답시간(token/s)을 착수 직후 PoC로 실측·확정합니다 [가정/검증예정]. 단일 장비로 부족한 부하는 ① 비동기 큐잉·배치 ② 민감도별 처리 분리(민감 데이터는 온프레미스, 비민감·고난도는 외부 API 폴백 — CFO-IT 보안정책 협의) 확인 필요로 흡수합니다.
- 환경 구성: AI 코딩에이전트(바이브 코딩) + GB10 온프레미스 LLM 연계 [가정/제안 — 인터뷰 확정]. GB10 정확 대수·사양은 [확인 필요 — §14].
- 재택 운영: VPN 기반 4일 재택 + 주 1일 방문으로, 부서 코치의 페어개발은 방문일에 집중하고 일상 개발·리뷰는 원격으로 수행.
12. 수행 실적과 팀
12.1 제안사 개요
MKVista — 플랫폼·AI 컨설팅 및 풀스택 개발 전문 (2024.04 설립) [사실: 제안사 경력자료]. 플랫폼 개발 컨설팅, AI 도입 컨설팅, 풀스택 개발을 수행합니다. 핵심 기술 역량은 AI/LLM·RAG(LangChain·LlamaIndex), 빅데이터(Spark·Hadoop), 풀스택(Next.js·Nuxt.js·FastAPI), 클라우드(AWS·NHN Toast·Docker·Kubernetes) 입니다 [사실: 경력자료].
12.2 핵심 인력 — 김종현 (대표)
총 경력 14년 · 20개 프로젝트 수행 [사실: 경력자료]. 데이터엔지니어링·AI 플랫폼·풀스택 전 영역을 직접 설계·구축해 온 실무 리더로, 본 사업의 PM/아키텍트 겸 AI 리드를 맡습니다.
| 분류 | 보유 역량 (실증 경력 기반) |
|---|---|
| AI/LLM·RAG | LangChain·LlamaIndex 기반 AI 시스템 기획·개발 (MKVista, 나인커뮤니케이션) |
| 빅데이터·이상탐지 | 실시간 분석·어뷰징 탐지·추천 시스템 (넷마블), 금융 빅데이터/AI 플랫폼 (KB국민은행, 데이터엔지니어링/AI 플랫폼 과장) |
| 풀스택·플랫폼 | 웹 프론트/백엔드, 시스템 설계, 개발 가이드라인 수립 (개발 수석) |
| 연구개발 | IEEE 국제학회(ICCAE 2010) 및 인터넷정보학회 논문(2009) 발표 — 가상화·분산시스템 |
12.3 RFP 5개 과제와 직결되는 유사 실적
평가의 핵심: "비슷한 일을 해봤는가". MKVista 핵심 인력의 실증 경력이 5개 과제에 1:1로 매핑됩니다 [사실: 경력자료].
| RFP 과제 | 직결 실적 | 연결 근거 |
|---|---|---|
| 과제1 품질·이상탐지 | 넷마블 실시간 분석 기반 어뷰징 탐지 시스템 개발 | 이상징후 탐지 = 동일 기술 영역 |
| 과제1·4 RAG 검색 | LangChain·LlamaIndex 기반 AI 시스템 개발 (MKVista) | RAG/문서검색 직접 구축 경험 |
| 과제1·2 대규모·보안 데이터 | KB국민은행 행내 빅데이터/AI 플랫폼 (금융 규제환경) | 민감·대규모 정형데이터 처리 |
| 과제2·5 추천 | 넷마블 배치분석 기반 유저 맞춤 추천 시스템 | BOM·Part 추천 로직과 동형 |
| 현업 앱 코칭 | 풀스택(Next.js·FastAPI) + 개발 가이드라인 수립·시스템 설계 | 바이브코딩 코치·코드리뷰 역량 |
| 데이터 파이프라인 | Spark·Hadoop·실시간/배치 분석 다수 (통신·게임·금융) | 공통 플랫폼(수집·파싱) 구축 역량 |
12.4 차별화
단순 SI(수행사 단독 개발·납품)가 아니라 현업 인에이블먼트 + 교육 + 완전 이관 모델. "만들어 주는 회사"가 아니라 "스스로 만들게 하는 회사". 특히 현업이 자연어로 쓰는 스킬·MCP 도구 패키지(사내 시스템 연동 MCP + 부서별 바이브코딩 스킬)를 제공해 비개발자도 AI 앱을 만들게 하고, 공통 데이터 파이프라인은 수행사가 직접 구축하는 역할 분담형 모델입니다. MKVista는 컨설팅과 풀스택 개발을 함께 제공하므로, 현업을 코칭하며 안전망을 대는 본 사업 구조에 정합적입니다.
추가 확정 항목: 본 사업은 수행사가 공통 데이터 파이프라인·플랫폼을 직접 구축하고, 현업이 스킬·MCP 도구로 부서별 앱을 개발하는 역할 분담형 구조입니다(§5.3·§9). 동시 수행 부하가 큰 구간의 추가 투입 인력·구성과 보안 인증(ISMS-P 등) 보유 현황은 발주사 협의·견적 단계에서 확정하며 확인 필요, 필요 시 협력 네트워크로 보강합니다. 발주사 리스크를 더 낮추기 위해 §6.6의 1과제 선행 파일럿으로 역량을 먼저 실증할 것을 권장합니다.
12.5 수행 연속성 보증 — "1인 의존" 우려에 대한 정직한 대응
본 사업은 김종현(대표)을 핵심 수행자로 하는 소규모 정예 구조입니다. 발주사가 가질 수 있는 "핵심 인력 부재 시 사업이 멈추지 않는가"라는 우려에, 회피 대신 구조적 장치로 답합니다 [제안].
| 장치 | 내용 |
|---|---|
| 지식 비속인화(상시) | 모든 코드·과제정의서·프롬프트·세션 로그·운영 매뉴얼을 착수 시점부터 사내 저장소에 귀속합니다. §7 완전 이관 장치와 동일하며, "수행자 머릿속에만 있는 자산"을 원천적으로 없앱니다 |
| 표준 스택 채택 | 공통 플랫폼을 검증된 표준 오픈스택(LangChain·LlamaIndex·FastAPI·표준 RAG/IDP)으로 구성해 제3자도 인수·유지보수할 수 있게 합니다(특정 인력 종속 회피) |
| 백업 인력 발동 조건 | 핵심 인력의 장기 부재 등 연속성 리스크 발생 시 협력 네트워크의 백업 인력을 투입하는 조건·절차를 계약 시 명문화합니다 [확인 필요 — 발주사 협의] |
| 조기 실증 | §6.6 선행 파일럿으로 사업 초기에 역량·산출물을 가시화하여, 핵심 의존 구간을 발주사가 조기에 확인·관리하게 합니다 |
"1인 수행"의 리스크는 자산 비속인화 + 표준화 + 백업 발동 조건 + 조기 실증으로 닫습니다. 이는 본 제안의 '현업 내재화·완전 이관' 철학(속인성 제거)을 수행사 자신에게도 동일하게 적용한 것입니다.
13. 기대 효과
| 구분 | 효과 | 근거 |
|---|---|---|
| 업무 효율 | 5개 업무 시간 50~80%↓ | RFP KPI [목표 slide3~7] + 지식노동 글쓰기 −40%(사실 Science 2023) |
| 품질·신뢰 | 보고 표준화·휴먼에러 저감·업무 연속성 | 과제1·2·5 정성목표 사실 |
| 안전·준법 | 위험성평가 객관화·중대재해법 대응 | 과제4 + 법제처 규제 사실 |
| 수주 경쟁력 | 데이터 기반 수주 의사결정(Opportunity Radar) | 과제3 + 반도체 1조 달러 시장(사실 WSTS) |
| 조직 역량 | AI를 직접 만드는 조직으로 전환, 현업 AI 활용 전문가 양성 | 도입 88%→가치실현 6%의 격차를 넘는 내재화(사실 McKinsey) |
정량 절감액 산출 방법과 샘플 추정
산식: 연간 절감 시간 = (현 작업시간 − 도입후 작업시간) × 연간 작업 건수, 절감액 = 절감 시간 × 시간당 인건비. 실값은 부서별 업무량·인건비 데이터로 확정합니다 확인 필요. 아래는 보수적 가정 샘플입니다 [가정 — 실측 시 보정].
| 과제 | 건당 절감 | 가정 작업량 | 연간 절감 시간(샘플) |
|---|---|---|---|
| 1 품질 보고서 | 2.5h→0.25h (2.25h) | 주 5건 × 50주 | 약 560시간 |
| 4 위험성평가 | 2h→1h (1h) | 주 5건 × 50주 | 약 250시간 |
| 5 곡선 추출 | 10m→2m (8m) | 주 30건 × 50주 | 약 200시간 |
위 3개 과제만으로도 부서별 연 수백 시간 규모의 절감이 추정됩니다(과제2·3은 의사결정 품질·속도 개선이라 시간 환산이 더 복잡). 정확한 금액은 착수 후 베이스라인 실측(§8.0)으로 financial-model에서 확정합니다.
14. 부록 — 확정 필요 항목
제안 완성도를 위해 다음을 발주사·제안사와 확정합니다.
| 구분 | 항목 |
|---|---|
| 제안사 | 정식 회사명·소개, 유사 실적·레퍼런스, 핵심 인력 프로필, 보안 인증 |
| 발주사 | 발주 법인 정식 범위, 제안 마감·발표 일정, 사업 예산·계약형태·투입 MD |
| 환경 | GB10 정확 사양·대수, VPN/보안 정책, 외부 API 허용 범위 |
| 연동 | QDMS·구매DB·SOP 등 사내 시스템 연동 스펙 |
| 데이터 | 과제3 외부데이터 허용 출처·라이선스, 부서별 업무량(효과 산출용) |
제출 전 확정 체크리스트
| # | 확정 항목 | 담당 | 상태 | 마감 |
|---|---|---|---|---|
| 1 | 정식 회사명·소개서 | 제안사 | ☐ 미확정 | 제출 전 |
| 2 | 유사 구축 실적 3건+(도메인·규모·성과) | 제안사 | ☐ 미확정 | 제출 전 |
| 3 | 핵심 인력 4역할 이력 | 제안사 | ☐ 미확정 | 제출 전 |
| 4 | 보안 인증(ISMS-P 등) 보유 현황 | 제안사 | ☐ 미확정 | 제출 전 |
| 5 | 제안 마감·발표 일정 | 발주사 | ☐ 미확정 | 즉시 |
| 6 | 사업 예산·계약형태·투입 MD | 발주사 | ☐ 미확정 | 견적 전 |
| 7 | GB10 사양·대수, VPN/보안정책 | 발주사 CFO-IT | ☐ 미확정 | 환경설계 전 |
| 8 | 사내 시스템(QDMS·구매DB·SOP) 연동 스펙 | 발주사 | ☐ 미확정 | 착수 직후 |
| 9 | 착수일·완료목표 | 발주사·제안사 | ☑ 착수 7/1·완료 10/25 | 확정 |
| 10 | 부서별 업무량 베이스라인(효과 산출) | 공동 | ☐ 미확정 | 착수 직후 |
증거 표기: 사실 검증된 출처/발주문서 · 추정 합리적 추론 · 가정 제안사의 설계 전제 · 목표 달성 목표(미실측) · 확인 필요 추후 확정.
모든 핵심 통계의 출처는 아래 「출처 색인」(별첨
출처-색인.md로도 제출)에 주장·수치·출처기관·URL(클릭 시 원문 이동)·신뢰도·반영섹션으로 기록되어 있습니다. 본문의 출처 표기(예: S4)를 클릭하면 해당 출처 행으로 이동합니다.
별첨. 출처 색인 (Source Index)
본문에 인용한 핵심 통계의 주장·수치·출처기관(연도)·URL·신뢰도·반영 섹션을 정리한 색인입니다. URL을 클릭하면 원문(새 탭)으로, 본문의
[S4](#S4)식 표기를 클릭하면 이 색인의 해당 행으로 이동합니다.신뢰도: ★★★ 1차 직접 출처 / ★★☆ 교차검증 / ★☆☆ 2차·벤더 발표(명시 인용).
| # | 주장 | 수치 | 출처(기관·연도) | URL | 신뢰 | 반영 |
|---|---|---|---|---|---|---|
| S1 | 바이브코딩 기원·정의 | Karpathy 2025.2 명명, Collins 2025 올해의 단어 | Wikipedia / Collins 2025 | en.wikipedia.org/wiki/Vibe_coding | ★★☆ | §2·§5 |
| S2 | 최전선 AI코딩 채택 | YC W25 25%가 코드 95% AI생성 | TechCrunch 2025.3 | techcrunch.com/2025/03/06 | ★★★ | §2·§5 |
| S3 | 코딩 생산성 | Copilot 55%↑(JS 한정), McKinsey 코드 35~45%↑ | GitHub 2022 / McKinsey 2023 | github.blog; mckinsey.com | ★★★ | §5·§13 |
| S4 | 균형근거(과신 경계) | METR 숙련개발자 19%↑소요, 주니어 7~10%↓ | METR 2025.7; McKinsey 2023 | arxiv.org/abs/2507.09089 | ★★★ | §5·§6·§7 |
| S5 | 시민개발 트렌드 | AI코드어시스턴트 엔지니어 2028 75%; 로우코드 IT외부 2026 80% | Gartner 2024.4 / 2022.12 | gartner.com PR | ★★★ | §2·§5 |
| S6 | 온프레미스 당위 | AI 미도입 최대 장벽 = 데이터 프라이버시 57% | IBM AI Adoption Index 2023 | newsroom.ibm.com | ★★★ | §11 |
| S7 | GB10 / DGX Spark | 128GB 통합, 1PFLOP FP4, 단일 200B·2대 405B 추론, 4TB 자체암호화 | NVIDIA 2025 | nvidia.com/dgx-spark | ★★★ | §4·§11 |
| S8 | AI 경제가치 | 연 $2.6~4.4조, 업무시간 60~70% 자동화 잠재 | McKinsey MGI 2023.6 | mckinsey.com | ★★★ | §1·§13 |
| S9 | 지식노동 생산성 | 글쓰기 시간 −40%·품질 +18%(Science); 고객지원 +14%(저숙련 +34%) | Noy&Zhang Science 2023; NBER w31161 | science.org/10.1126/science.adh2586 | ★★★ | §5·§13 |
| S10 | 스마트공장 효과(국내) | 생산성 30%↑·품질 43.5%↑·원가 15.9%↓·산재 18.3%↓ | 중기부 2019.5 | mss.go.kr | ★★★ | §2·§13 |
| S11 | 제조 AI 블루오션 | 제조 AI 도입 0.1%·계획 1.6% | 중기부 2024(KDI) | eiec.kdi.re.kr | ★★★ | §2 |
| S12 | AI 자율제조 정책 | 2030 생산성 20%↑·GDP 3%↑, 민관 2.5조원+ | 산업부 2024.5 | motie / aitimes | ★★☆ | §2·§13 |
| S13 | 품질 AI 도입 | 품질 GenAI 파일럿·배포 89%, 전사 구현 15%뿐 | Capgemini WQR 2025-26 | capgemini.com | ★★★ | §8 |
| S14 | 조달 AI | 조달 생산성 25~40%↑; CPO 92% 계획 vs 37% 실행 | McKinsey 2024; Deloitte CPO 2024 | mckinsey.com; deloitte.com | ★★★ | §8 |
| S15 | 중대재해처벌법 | 2022.1.27 시행, 2024.1.27 5인 이상 확대, 경영책임자 1년↑징역 / 10억↓ 벌금 | 법제처 2021 | law.go.kr lsiSeq=228817 | ★★★ | §2·§8 |
| S16 | 산재 사망 | 2023 조사대상 598명 중 50인 미만 59%·제조 170명 | 고용노동부 2024.3 | moel.go.kr | ★★★ | §8 |
| S17 | 위험성평가 의무 | 산안법 제36조, 고시 2024-76호(2025.1.2), KRAS 243 소분류 | 법제처 / KOSHA | law.go.kr; kras.kosha.or.kr | ★★★ | §8 |
| S18 | 반도체 시장 | 2026 $9,750억(1조 근접), 장비 2027 $1,560억 | WSTS 2025.11; SEMI 2025.12 | wsts.org; semi.org | ★★★ | §2·§8 |
| S19 | 원익 소부장 정체성 | 원익홀딩스 = 반도체·디스플레이 소재·부품·장비(특수가스 지주), 원익IPS 장비 | 원익홀딩스 공식 | wonikholdings.kr | ★★★ | §2·§8 |
| S20 | AI 완수 실패(핵심) | MIT 95% P&L 미달; RAND 80% 실패; Gartner 30% PoC 폐기; McKinsey 유의미 성과 6% | MIT NANDA / RAND / Gartner / McKinsey 2024~25 | mlq.ai; rand.org RRA2680-1 | ★★★ | §6 |
| S21 | RAG 법령 환각 | 법률 RAG 도구도 환각 17~33%("6건 중 1건") | Stanford RegLab(Magesh) 2024 | arxiv.org/abs/2405.20362 | ★★★ | §8·§10 |
| S22 | IDP 정확도 편차 | 표 추출 Azure DI 87%·Textract 82%·GPT-4o 63%, 유형별 40~99% | Businesswaretech 2024 | businesswaretech.com | ★★☆ | §8 |
| S23 | 곡선 디지타이징 | 깨끗한 단일곡선 ~99%, 실차트 LineFormer 88.25% | Wojtyniak 2020; LineFormer 2023 | PMC7306621; arxiv 2305.01837 | ★★★ | §8 |
| S24 | 제안사 실적 | MKVista 김종현 14년·20프로젝트: 넷마블 이상탐지·추천, KB국민은행 빅데이터/AI, LangChain/LlamaIndex, IEEE/인터넷정보학회 논문 | 제안사 경력자료(자유형식) | 제안사 제출 | ★★★ | §12 |
인용 원칙
- 벤더 발표(Anthropic 사례·Klarna·Cursor 등)는 "기업 발표 기준"임을 명시하여 인용합니다. [S20 주의] "95% 실패"가 아니라 "95% P&L 미달"로 정확히 표기합니다.
- 한국 정부 1차 통계(S10·S11·S15·S16·S17·S18·S19)를 핵심 주장의 앵커로 사용합니다.
- 균형 근거(S4)를 반드시 병기하여, "AI는 '도입'이 아니라 '완수·교육·측정'으로 효과가 발현된다"는 본 제안의 핵심 메시지를 뒷받침합니다.
방법론 근거 출처 (Methodology Sources — §5.4)
§5.4 「지식 이식 방법론」의 학술·실무 근거입니다(고전 지식공학·조직이론 + 최신 LLM 인코딩·실증). 신뢰도 표기는 위와 동일. 본문의
[Polanyi](#M1)식 표기를 클릭하면 해당 행으로 이동합니다.
| # | 개념 | 핵심 | 출처(저자·연도) | URL | 신뢰 |
|---|---|---|---|---|---|
| M1 | 암묵지 | "말할 수 있는 것보다 많이 안다" — 숙련은 판단을 무의식으로 압축 | Polanyi 1966 | en.wikipedia.org/wiki/Tacit_knowledge | ★★★ |
| M2 | 암묵지 3유형 | 관계적(인코딩 가능)·신체적(예시 스캐폴딩)·집단적(사람 루프) | Collins 2010 | press.uchicago.edu | ★★★ |
| M3 | SECI 모델 | 암묵지↔형식지 4모드 나선 · 외재화=metaphor→analogy→model | Nonaka 1994; Nonaka & Takeuchi 1995 | doi.org/10.1287/orsc.5.1.14 | ★★★ |
| M4 | "Ba"(場) | 지식 창출의 공유 맥락 — 외재화는 대화형 ba에서 | Nonaka & Konno 1998 | doi.org/10.2307/41165942 | ★★★ |
| M5 | 정규/비정규 실천 | 공식 SOP가 아니라 '실제 작동방식'에 진짜 지식 | Brown & Duguid 1991 | doi.org/10.1287/orsc.2.1.40 | ★★★ |
| M6 | CTA·CDM | 인지적 과업분석·결정적 사건법 — 결정을 probe(인터뷰 아님) | Klein et al. 1989; Crandall et al. 2006 | doi.org/10.1109/21.31053 | ★★★ |
| M7 | 실천공동체 | 상황학습·정당한 주변적 참여로 전문성 전이 | Lave & Wenger 1991 | en.wikipedia.org/wiki/Community_of_practice | ★★★ |
| M8 | SECI 실증 | 외재화=Team Reflexivity+Organizational Memory(심리측정 검증) | Farnese et al. 2019 | pmc.ncbi.nlm.nih.gov/articles/PMC6914727 | ★★☆ |
| M9 | 도출 3조건 | 관할 명확·업무 핵심성·수행 동질성(없으면 도출 실패) | Stanford DSE 2024 | digitaleconomy.stanford.edu | ★★☆ |
| M10 | LLM 인코딩 | Contextual Retrieval·evals — 전문가 품질판단=rubric·회귀 테스트 | Anthropic 2024~26 | anthropic.com/news/contextual-retrieval | ★★★ |
| M11 | 지식 은닉 | AI 대체 두려움에 약 1/3이 전문지식 의도적 은닉 | Adaptavist 2025 | hrreporter.com | ★★☆ |
| M12 | 생성코드 취약 | AI 생성 코드 45%가 OWASP 취약 → 검수·보안 게이트 당위 | Veracode 2025 | veracode.com | ★★★ |