본문 바로가기
  • 한컴 AI 아카데미 AI개발자 4기
한컴 AI 아카데미

[스나이퍼팩토리] 한컴 AI아카데미 4기 프로젝트 6주차

by 타스타로스 2026. 6. 12.

6주 차입니다 

중간발표가 끝나서 그런지 팀원들이 전부 시들시들하네요

그래도 마지막 까지 힘들게 달려 보겠습니다 

요번 주차는 클라으드와, 배표가 주목적이었습니다.


1. 클라우드 서비스 

먼저 클라우드 서비스는 아마존의 EC2서비스를 이용하기로 했습니다.

아시는 분은 아시겠지만 이 업체는 연간 어마무시하게 벌고 있습니다 그런데도 서비스 비용이 비싸요 무료도 있는데 말이죠

접속하는 방법은 링크 걸어 드립니다.

이곳은 정식 써비스~

https://docs.aws.amazon.com/ko_kr/AWSEC2/latest/UserGuide/EC2_GetStarted.html

이곳은 제가 유용하게 쓴 블로그입니다

https://haburu23.tistory.com/43

특히 주의할 점으로 곱자면 지역 변경입니다.

변경 안 하면 금전적으로 낭패를 볼 수 있다는 지인의 조언이 있었습니다^^

이 부분을 꼭 서울로 변경 바랍니다.

그다음으로 중요도를 꼽자면 인스턴트 연결 후 리눅스 입력창에서 복사해서 넣을 때 쉬프트+컨트롤+v 정도는 농담이고

도커를 사용하셨다면 필히 깃허브 푸시 전에 백앤드와 몽고 DB만 따로 컨테이너로 묶으셔야 해요 물론 전부 가져오셔도 상관은 없지만 도커를 사용하신다면 그쪽이 용량도 적어지고 편하니 알아두셔요 

인스턴트 시작 시 용량이 30기가까지 무료예요 8기가 되어있다고 그냥 쓰시지 마시고 꼭 늘려서 사용하시는 걸 추천드립니다

나중에 물론 바꿀 수 있지만 한 가지 더 설정해야 하는 번거로움이 생기니 추천!

마지막으로 저힌 도메인 8000을 사용했는데 이걸 설정해 줘야 해요 물론 SHH가 잘 잡혀 별 걱정 안 하시겠지만 프런트에서 연동하기 쉬은 보안 설정을 하시는 게 맘이 편해요.


 

2. VERCEL 배포

배포라고 해서 단순히 URL 받고 등록해서 비용지불하고 도메인 사용하는 걸 줄 알았는데 

의미가 다르더군요 프런트앤드만 따로 불리해서 사용할 수 있도록 하는 서비스예요 .

버쉘은 처음 가입 시 100 크레디트를 줘요 정말 고맙 줘 이것도 링크 걸오 볼게요.

이 블로그가 젤 보기 쉬웠어요 .

https://codingworld2002.tistory.com/214

정식 안내 싸이트는 쓰레기입니다 링크도 안 걸 거예요.

블로그 보시면 알겠지만

 

ADD NEW... 이 부분 누르시고 프로젝트 누르면 끝

아!! 로그인 가입 시 꼭 깃허브로 가입하시는 걸 추천드려요.

아니면 다시 깃허브 인증을 받아야 사용가능 하다는 점 우리 같은 귀차니즘들은 

꼭 깃허브로 가입하기 약속!

 

 

 

 

누르고 들어간 부분에서 

이 부분에서 깃허브 연동이 되어있으면 보시는 봐와 같이 친철히 불러오기 (import)

누르시면 끝!

 

 

 

 

다음은 백앤드 연동입니다

EC2 인스턴트에 나와있는 URL 클릭 붙여 넣으시면 됩니다

KEY는 인스턴트 생성 시 생성하셨을 거어요

참 쉽죠! 밥 아저씨도 울고 갈 거예요 (바비 킴 말고)

 

 

참고로 불러오기 는 FROUNTEND 만 가져오시는 겁니다

깃허브에 올리실 때 꼭 배포용으로 백앤드, 몽고 DB 도커로 묶고 프런트앤드는 따로 빼두셔요 그렇다고 나눠서 저장소 만드는 바보짓은 안 하시겠죠 ㅎ( 난 했었음 ㅋㅋ)


3. 분석 페이지

엄청 많은 변화가 있었습니다 

보이는 봐와 같이 UI/UX변경이 많이 있었고 반응형을 끝내 버렸습니다( 뿌듯)

잠시 날 거 하자면

  1. 거짓보고 방지
    코드상 백엔드가 웹 검색 API를 호출하는 흔적은 없습니다. 다만 OpenAI/Gemini가 “문서 콘텍스트 + 이전 대화”를 보고 답하는 구조라, 문서에 없는 수치도 모델이 그럴듯하게 보태는 위험이 있고, 현재 grounding 실패 시에도 LLM 답변을 버리지 않고 합쳐서 보여주는 문제가 있습니다. 이제 이걸 “문서/미리 보기 근거 없으면 답하지 않기”로 고치겠습니다.(변경 파일 analysis.py, analysis_pipline.py, prompt_builder.py)
  2. 챗봇 기반 변경 더 이상 같은 분석만 반복하지 않습니다 전엔 규칙기반의 챗봇이라 준비된 프롬프트(분석, 요약, 중요문장, 중요도, 핵심, 반복 많은 단어)에 의한 답변이었는데 , 좀 더 llm기반 (RAG) 오픈소스(llama, qwen3) 기반으로 작동하게 변경하였습니다. (backend/services)
  3. 분석 후 방식 변경 추천 시각화 2개, 연관 질문 2개만 반영합니다 무분별한 클릭을 방지하기 위해 연관질문은 3회만 반복하도록 체인을 만들었습니다 모든 문서는 미리 보기/업로드 문서만 컨텍하도록 고정하였습니다 (prompt_bulider.py, response_utils.py, Analysis.tsx, Analysis.styles.ts)
  4. 진짜 문서 분석 기본은 문서 전용, 사용자가 명시적으로 웹 비교를 원 할 시만 웹에서 검색하는 방식을 넣었습니다 진정한 하이브리드 문서 파싱 챗봇으로 일하게 만들고 있습니다.(web_search.py, analysis_pipeline.py, prompt_builder.py, gemini_provider.py, sckemas.py)
  5. 문서 작업 버그 수정 여러 문서를 넣을 시 맨 처음 문서를 다음 문서에 같이 분석해서 보여주던 방식을 미리 보기에서 클릭한 문서만 분석하고, 비교(차이, 공통점, 두 문서, 여러 문서, 전체 문서, 모든 문서)나 검색 시에 모든 문서를 보도록 변경하였습니다.(analysis.tsx, api.ts, analysis.py)
  6. 영문 hwpx를 검증에서 거부하는 버그 llm 호출 후 영문 문서원본을 파싱 후 답변을 하는데 , 한글로 우선 답변하게 묶어서, llm은 문서는 영문인데 왜 한글로 답변해? 하면서 실패 다시 로컬 fullback로 보내서 파싱분석 후 답변 내보내게 하는 걸 잘 타일러서 llm도 답번 하도록 수정했습니다(grounding.py)

이 정도?


4. 백앤드 정리

파일 트리도 v8 오면서 대단위적으로 변경되었습니다.

제가 개발에 참여하는 부분이 백앤드라 이번에 큰맘 먹고 , 보기 쉽고, 알기 쉽고, 컴도 연동하기 쉽게 개선했습니다

 

 

전체 적인 빌드가 바뀌었습니다

app는 core, router, secices로 나누어 확실히 선택과 시안성이 개선되었습니다

어라 바꿘게 없다고요?

그러네요 ㅋ

 

 

 

 

 

 

 

 

 

 

안에 내용은 이렇게 변했어요 

신설된 코드들이 보이시죠 

물론 관심이 없으면 안 보이십니다 

아 보요 드린 적이 없군요 

이 부분이 백앤드의 뼈대라고 보시면 됩니다.

설명이 듣고 싶으시면 오백 원 동봉으로 메일 주셔요

 

 

라우터입니다 

분석부터 비주얼까지 모두 프런트 앤드와 연동시켜 주는 부분입니다

이 부분도 중요해요 모든 걸 저장할지 사용할지 결정하고

몽고 db와 도커도 이 부분이랑 친하게 지내요

물론 백앤드의 다른 폴더들도 메인 다음으로 이 폴더를 좋아할 거예요.

이 부분도 탄탄하게 만들면 쭉 쓰입니다

 

 

 

서비스!! 서비스 !!

진짜 핵심은 이거죠 우리 챗봇의 머리입니다

여기서 분석, 임베딩, 파싱, 청크, 랭체인, 토픽, 검증 등등 llm과 문서를 만들고 쪼개고 씹고 맛보고 나중에 답변가지 모든 걸 처리하는 부부입니다.

더 작은 폴더까지 보여 드리고 싶지만 우리가 트랜스포머쓰고, 파이썬 쓰고, 리마에 규원 3까지 쓰는 거 보여주고 싶지 않아서 여기서 멈추겠습니다.

우리 hwp, hwpx, pdf 전용 쳇봇이어요 물론 멀티모달도 사용해서 이미지, 오 씨알도 잘 읽어요 

환각증상을 줄이려고 검증 부분을 너무 힘들게 넣어서 우리 챗봇은 성질나면 영어에 외계어도 쓴답니다  


5. 후기

이제 막바지입니다 2주 열심히 해서 사용할지 출시할지는 모르겠지만 분명 한글 문서를 읽고 분석하는 챗봇 중엔 당연 일등이라 생각이 듭니다. 라이너라는 시중문서 해독 사이트가 있긴 한데 그래도 장단점은 다들 있어요 

아직 로컬로는 시원한 답변을 보긴 힘듭니다만 api-key를 넣으면 제미나이, 클로드 비슷하겐 나와요 ㅎ

다음 주에 분석 페이지 위주로 시연하는 블로그를 작성해 드리겠습니다.

 

 


본 후기는 [한글과 컴퓨터 x한국생산성본부 x스나이퍼팩토리] 한컴 AI 아카데미 (B-log) 리뷰로 작성되었습니다.

#한컴 AI아카데미 #AI개발자 #AI개발자교육 #한글과 컴퓨터 #한국생산성본부 #스나이퍼팩토리 #부트캠프 #AI전문가양성 #개발자교육 #개발자취업