본문 바로가기
  • 한컴 AI 아카데미 AI개발자 4기
한컴 AI 아카데미

[스나이퍼팩토리] 한컴 AI아카데미 4기 프로젝트 8주차 마지막

by 타스타로스 2026. 6. 24.

사실 블로그 쓴 후에 한 번도 안 열어봄 ㅡ.ㅡ

사실 블로그 쓴 후에 다시 리 터치할 생각이었음 ^.^

그러나 이게 마지막 이네요 ㅠ.ㅠ

금방 지나 갔어요 0.0 

처음 두달이 추웠지  힘들고, 시간이 안 갔지 그 이후론 6달 금방이네요.

프로젝트 시작시 기획서 짜면서 들떠있던 마음은 어느새 짜증과 기다림으로 바뀌었고, 코드를 짜면서 더 공부가 되는 게 신기하게 느껴지더라고요 라스트 페이퍼메이트를 보여 드리겠습니다.

도매인 주소 :https://papemate.vercel.app/

 

PaperMate

 

papemate.vercel.app

우리 웹 아키텍쳐 :https://taxtaros.github.io/architecture/

 

PaperMate 아키텍처

 

taxtaros.github.io

취직 전까지만 서비스~! 서비스~!!


1. 메인 페이지

애증의 메인 페이지 깔끔한 파스텔 느낌의 보기쉬운 UI, 사용감 쩌는 UX 우리가 만들었지만 잘 만든 거 같아요.

로고는 팀장님이 제작 했고 기본 바탕은 팀원 K가 그 안에 텍스트는 거의 내가 한 거라 3명이 모두 공을 들인 부분 


2. 분석 페이지

정말 많은 시간을 모두가 투자 했던 부분 앞서 스크린샷을 보시면 알겠지만 이타적 경쟁심이 뿜뿜이던 페이지입니다.

기본을 로컬 FALLBACK에서 가져온 놈이라 사실 기타 멍청한 챗봇 보단 거의 문서전용 AI라 부를 수 있을 정도라 생각합니다.

물론 OWPML을 기반으로 문서를 파싱하고 위키독스, 깃허브, 웹을 뒤져서 여기서 조금, 저기서 조금씩 청킹 코드, 임베딩 코드, 정규화 코드 등을 가져다 바이브코딩으로 조합한 거지만 정말 잘 만들어졌어요. 

결국 OPENAI KEY를 사용해서 속도나 정확도를 더 올리긴 했지만 KEY 없이도 잘 돌아가는 기특한 녀석이 되었습니다. 

첨엔 TF-IDF를 사용하다가 BM-25가 최신이라길래 교체도 해보고 OCR이 안 읽혀 멀티모달도 도입하고 임베딩 강화에 jhgan/ko-sroborta-multitask 넣고, 영문 한글 번역기도 BAAI/bge-m3에서 Argos로 변경하고 나중엔 api-key 사용으로 빼버리기도 하고 배포하면서 도커가 너무 무거워져서 kor 관련 코드를 전부 false로 바꿔 인스턴트를 돌리고 했던 일도 있었고, 정말 많은 일이 단 몇 주 안에 지나갔네요 .


2-1. 이미지 추출

 

방식이 모든 문서를 파싱(정규화)해서 다시 pdf로 제구축 해서 pdf를 읽어 분석값을 내어주는 방식이라 청킹(중요도순서로 문장, 문단을 나눔) 들어가기 전에 표, 이미지, 불용어, 연속되는 숫자, 그래프 등을 빼고 모아두었다가 이미지 추출을 하면 ocr로 다시 검색해서 이미지만 추출해 주는 방식을 사용했어요 .


2-2. 표

표의 활용은 정말 글자를 한 개도 읽기 싫다 그래도 내용은 알아야겠다 싶은 분을 위해 만들었어요.

중요도 점수(청킹시 많이 표출되는 단어와 초록, 제목등을 대조하여 중요점수를 매김)와 정확도(제목과 중요내용의 일치도)를 측정하여 간단하게 30자 이내로 표현하도록 하였습니다 문서의 내용을 요약(초록), 서론, 본론, 결론으로 나눈 후 그중에 가장 중요한 한 줄 요약을 하도록 코딩하였습니다.


2-3. 그래프

제일 어려운 부분이었습니다. 먼저 그래프를 그리려면 x, y좌표의 연속되는 값이 필요해서 문서에서 그 값을 찾고 뽑아내는 게 쉬운 일이 아니었어요. 프롬프트를 정말 정밀하게 짜서 명령을 내려야 그려주는 수준이었는데 분석밑에 그래프를 그릴만한 자료가 나오면 연관질문으로 표현해서 그리도록 유도하였습니다. (사실 잘 안 됨)


2-4. 문서 비교

이것도 쉽지 않았어요 ㅎ 팀장님은 거의 1주를 이것만 매달렸죠.

미리보기창에 분석이 두 개 이상 뜨면 비교, 두면서, 양쪽, 비교해 줘, 틀린 점, 등등의 명령어를 미리 프롬프트 해두고 거기에 알맞은 단어가 챗창에 입력되면 비교하도록 만들었습니다 비슷한 문서는 비교가 쉽게 되나 전혀 동떨어진 문서면 확인되지 않음으로 띄우게 못을 밖았어요.


3. 프로젝트 페이지

모든 문서가 저장되는 페이지입니다

 

모든 분석 페이지가 저장됩니다 저장하면 초대코드를 자동 발급하고 이 초대코드로 공유작업공간에서 다른 유저와 채팅을 나누며 논의할 수 있도록 했습니다 시각화 보관함을 따로 두어 공유 분석을 할 때 활용하던지 내 컴퓨터로 저장할 수 있게 구성하였다.


4. 공유분석 페이지

내가 제일 많이 힘쓰고 혼자 만든 페이지 ㅋ

진짜 별거 없는 llm도 fallback도 안 들어가는 프런트앤드에서 가장 긴 코드를 자랑하는 페이지입니다.

물론 llm, fallback도 내가 거의 혼자 작업했지만 이 페이지는 처음 프랜트앤드를 나눠서 제작하자 했을 때 맞아 고민하고 어렵게 만들어서 더 애틋하고 마음 가는 페이지 ㅋㅋ

설명하자면 이미지(내 컴퓨터에서) 불러올 수 있고, 시각화 자료실에서 저장된 시각화 자료 불러오기 다른 프로젝트 카드도 불러올 수 있고 분석을 더하고 싶음 더 분석해 올 수도 있고 따로 저장도 가능하며, 초대코드로 5명까지 초대 가능하고, 채팅으로 담소를 나누면 타임라인의 번호로 공유의 방식도 알려줄 수 있고 또 반응형이 기가 막힙니다. 

설명할 건 많지만 여기까지 마지막이라 너무 길어지네요.


후기

다른 블로그들 보니까 첩은엔 열심히 쓰다 뒤로 갈수록 흐지부지 되는 게 많이 있더군요.

그래도 전 열심히 써서 뿌듯합니다(성의가 없는듯하지만 복불보단 나은 듯)

여기서 열심히 강의해 준 강사님이랑, 서포트하느라 고생하신 매니저님께 고맙고 감사하단 말을 하고 싶네요.

이쪽으로 일하고 싶지만 이 블로그 작성하는 나이가 나이인지라 그냥 돈 많이 주는데 가렵니다 ㅠㅠ

다음엔 일인 게임 개발 블로그 써 볼게요 기회가 되면, 

늙은이여서 그런지 노션보단 블로그가 좋아요 ㅋ

그럼 빠이!

내 포트폴리오:https://my-portfolio-ten-khaki-82.vercel.app/

 

최우형 개발자 포트폴리오

Study Log 현장 경험 위에 웹, 데이터, AI를 쌓아 올리는 중입니다. 한컴 AI 아카데미 AI 개발자 과정 4기에서 웹 프론트엔드, 백엔드, 데이터베이스, 클라우드, 데이터 분석, 딥러닝, 자연어 처리를 교

my-portfolio-ten-khaki-82.vercel.app

깃 허브: https://github.com/TaxtaroS/papemate

 

GitHub - TaxtaroS/papemate: PaperMate project

PaperMate project. Contribute to TaxtaroS/papemate development by creating an account on GitHub.

github.com


본 후기는 [한글과 컴퓨터 x한국생산성본부 x스나이퍼팩토리] 한컴 AI 아카데미 (B-log) 리뷰로 작성되었습니다.

#한컴 AI아카데미 #AI개발자 #AI개발자교육 #한글과 컴퓨터 #한국생산성본부 #스나이퍼팩토리 #부트캠프 #AI전문가양성 #개발자교육 #개발자취업