교수님 피드백

날짜
2023/09/19
태그
수업
기타
피드백에 따른 계획
피드백 내용
문제 사항 제시부터 OCR 기반에 어떤 것이 있고 우리는 그런데 어떤 거 하고자 한다 시각장애인용 서비스는 어떤 것이 있다(OCR는 너무 방대해서 어떤 서비스 있는지XX) 생리대 추천 시스템하고 OCR 기반으로 한다
그거하기 위해 데이터셋 어떻게 사용 생리대 데이터 총 몇개 실험 계획이 아니라 사용계획에 추가 어떤 항목기반 총 몇개 데이터셋
구축환경 -> 상장??에 기재
2-2절 OCR -> 필터링했다 어떤 모델에서 어떻게 했는지 OCR 설명(정의) 광학문자인식(OCR; op~) 텍스트 이미지를 통해서 뭐로 어떻게 인식하는지 설명 전처리 해야하고 문자 검출 무슨 모델 통해서 할지 text recognition
=> 다음 미팅에서는 OCR 설명 가능하게
2-3절 -> 컨텐츠 기반 필터링 컨텐츠 기반 필터링 먼지 OCR 인지하고 text 전처리 데이터 및 데이터 정제 -> 전처리라고 XX tf-idf 벡터화, 코사인 유사도 얘기
3장 총 데이터 셋에서 트레이닝한 데이터 몇 개, 테스트 몇 개 테스트 정해져야 함 성능 어떻게 평가 -> 수치적 분석 어떻게 할지
10/10 미팅 => 성능 평가 결과 가져오기 -> 성능 어느정도 나오는지 내가 적용한 거에 대한 성능 평가 1개 밖에 없음 -> OCR 필터링한 것과 하지 않은 것 차이 어느정도인지
논문 쓰려면 설명할 줄 알아야 함
=> (수정) 비교하지말고 성능 평가할 것 !!! OCR 설명, 컨텐츠 기반 필터링 어떤 건지 정확하게 설명
결과부분에 시스템 및 구축 추가 가능(어플리케이션 보여주기)
멀티미디어학회 양식 다운 -> 3장이내로 구성 진행 => 슬라이드 보완되면 그대로 들어감
8:2 -> 80개 정도? 성능 별로면 9:1로 하기

TO-DO

2장

1.
문제상황 → 계획 제시
시각장애인을 위한 서비스 조사
우리 서비스 설명(OCR + 생리대 추천 시스템)
실험 데이터 제시 (어떤 항목, 몇 건)
2.
OCR 설명
정의
어떤 모델에서 어떻게 구현했는지
무엇을 어떻게 인식하는지
전처리 필요 + 문자 검출 무슨 모델 통해서 할지 (text-recognition)
3.
추천 시스템 - 컨텐츠 기반 필터링
정의
OCR 인식 후 텍스트 전처리
‘전처리’ 대신 ‘데이터 정제’
tf-idf 벡터화 설명
코사인 유사도 설명

3장

1.
실험 내용
총 데이터 셋에서 트레이닝 데이터 건수, 테스트 데이터 건수 정하기 (8:2 / 9:1 추천)
성능 평가 방법 설명 (OCR, 추천 시스템 성능의 수치적 분석 방법)
2.
결과
성능 평가 결과 설명
(선택) 시스템 구축 → 구현한 어플리케이션 소개