Team Project (2022-2023)/High-Light 13

회고록

Keep (프로젝트에서 만족했고, 앞으로의 업무에서 지속하고 싶은 부분) 깃허브의 이슈, 브랜치 사용 해 작업 단위 마다 이슈로 정리해 놓은 것 다트, 플러터라는 새로운 언어와 프레임워크를 배우며 유의미한 결과물을 생성한 것 정기적으로 카메라를 킨 채 화상회의에 참여하고 그것을 노션에 기록해 정리한 것 깃 컨벤션이 체계적이었던 것 완성된 프로젝트를 GCP에 배포하는 경험을 얻은 것 문제 상황에 따른 아이디어 기획을 자세하게 진행한 것 Problem (프로젝트에서 부정적인 요소로 작용했거나 아쉬웠던 점) API 명세서 완성, 서버 연결이 전체적으로 늦어져 디버깅 할 요소가 많았고 미흡했던 점 클라이언트의 상태 변화 관리에 있어 효율성이 아쉬운 점 이미지 캡션을 달고 싶었는데 해당 모델을 가져와서 사용하지 ..

[12주차] 회의록

진행상황 공유 FE 텍스트 블록 터치시 → 오디오 재생 재생 속도 조절 / 재생(일시정지) 버튼 이미지 위젯 클릭 시 이미지 팝업/ 확대축소 및 드래그 기능 내 서재 → 폴더 목록 / 파일 목록 구현 메인화면 메뉴 내 서재/파일 추가 구성 변경 → 내 서재 바로 이동, 파일 추가버튼은 폴더 페이지로 이동 ML json 파일에 이미지 url 넣기 json 파일에 오디오 url 넣기 url 및 경로 코드 정리 GCP에 원하는대로 경로 설정 후 업로드 완료 BE 로그인 수정, 완성 페이지 api 명세서 수정 구글로그인 뜨는 문제 해결 페이지, 폴더 api 작성중 이번 주 계획 : 개발 마무리 및 폼/영상 제작 변경 사항 폴더 리스트 보여주는 방법 : 리스트 vs 그리드 뷰 버킷 url 구조 → 데이터베이스 경..

[11주차] 회의록

3/15 9시 회의 진행 개발 현황 공유 FE 구글로그인 액세스토큰 발행, 백으로 넘기는 것까지 세팅: jwt 토큰 발급하는걸로 가정해서 진행함 로그인 이후 메인 페이지 화면 줌인 줌아웃 제스처로 폰트 크기 조절 ML 이미지 추출 이상하게 되는 것 있음 - 검은색 화면, ppt 두개씩 한 화면에 나오는 문제, 표 내용이 텍스트로 변환되는 등… -> 해결 중 BE 구글 로그인 구현 파일 업로드 구현 수정, 요청 사항 백→프론트: response entity header에 status code 넘기기 특정 파일 조회 response에 총 페이지 개수 필드 추가: page_num 소셜 로그인에 jwt 토큰 발급 추가 이미지 캡션 우선순위는 뒤로 미루기 (캡션, 오디오 둘다 X) gcp에 올리는것 우선 개인 폼..

[10주차] 회의록

진행 상황 공유 FE 메인페이지 → json 파싱해서 레이아웃 구성 이미지 존재 시 별도의 이미지 위젯 띄우기 ML 텍스트 오류 → 정확도 상으로는 현재 사용한 패키지가 가장 정확하긴 해서,, 일단은 사용 예정 지정한 json 규칙대로 가공 중 서버에 올리기는 가능 (json 파일만) BE GCP 올리는 거 → 해결하지 못함 모각코 진행 3월 11일, 3월 12일에 디스코드를 통해서 모각코 진행 TODO ML 이미지 추출 정확도를 높히는 방법 찾기 이미지 캡션 → 텍스트, 오디오 넣기 url?, GCP? python 코드 어케 올려,,,,,,,,,,, 알아보기 ⭐ FE 구글 로그인 : 인증 및 토큰 발급 로그인 시 파일 목록 구현 페이지네이션 구현 : 파일 열 때 받을 페이지 번호 리스트 → 페이지로 구..

[9주차] 회의록

정확한 구현 방향 설정 1. Talk back 기능 이용 전체 읽기만 휴대폰 자체 talkback 기능 이용하기로 하고 단락읽기와 한줄읽기를 LeTurn에서 지원해주기로 결정 -> 문단별로 나눠주는 API가 없음. 폰트 사이별로 나누기엔 오래 걸릴 것 같음 2.한줄 읽기, 단락 읽기 기능 구현 시 구분 기준 줄글이 적어 단락이 없을 경우 한줄을 한 단락으로 인식하여 읽어주기로 줄글이 많아 단락의 구분이 있을 경우 들여쓰기 단위로 문단을 구분짓기로 문제점: - 한줄을 인식하려 할 때 피피티 자체에서 끊겨져서 나오는 텍스트가 출력되면 다른 줄처럼 출력됨 해결방안 1. Y축을 기준으로 다른 값이 나올 때 까지 한 문단으로 인식 2. 폰트 사이즈를 기준으로 문단엮기 결론 : 같은 폰트 사이즈끼리 묶는 식으로 데..

[8주차] 회의록

진행 상황 수요일 (2.22) 모각코 진행 API 작성 완료 GCP 연동 완료 시작화면 구성 완료 GDSC 윈터컵 해커톤 본선 준비 와이어 프레임 완성 UI 배치 부분 수정 발표 자료 준비 및 프로토타입 영상 촬영 다음 주 계획 ML 페이지 단위로 묶어서 하나의 json으로 도출 json 정리 (추출한 내용 통합) tts 변환 시도 FE 시작화면 구조 수정 (시작 화면 단순화) 소셜 로그인 연결 메인페이지 레이아웃 잡기 BE oauth키 작성 소셜 로그인 구현 로그인 끝내고 gcp 배포

[7주차] 회의록

진행상황 공유 BE - 초기 환경 세팅 - gcp, 소셜로그인 알아보기 FE - 초기화면 구성해보기… - 프로젝트 세팅 완료 - .gitignore - 플러터 공부 계속 하기 - 교재 공부 - 플러터 스터디 - 스토리보드 짜기 - ppt? oven ML - 이미지 구별 누끼따끼 논의 사항 - 개강후 주2회 모각코 (온라인+오프라인) - 베타테스트 기간 : 3/12 - 윈터컵 본선 진출시 참여 가능 여부 다음주까지 할일 BE - 개발환경 세팅 - 소셜로그인 키까지 작성 - API 명세서 확정 짓기 (2/18 오후 1시 회의) - 완성되면 프론트에 넘기기 FE - 로딩~ 로그인 화면 - 와이어 프레임 완성 - 플러터 공부 계속 - 깃 브랜치 셋업 ML - 만든 모델은 어떻게 GCP로 올리는지 알아보기(진행 ..

[6주차] 회의록

진행상황 공유 - ML GCP Vision API 사용해서 텍스트 추출 구현 이미지 추출은 contour detection 사용하는 것으로 결정 - FE 스크롤 페이지 구현 알아보기 오디오 재생 관련 패키지/오픈소스, 대체텍스트 읽어주는 라이브러리 조사 프로토타입 완성 - BE DB 설계 완료 API 명세서 작성 중 redis, 소셜 로그인 알아보기 프로토타입 확정 교수님 면담 피드백 ppt는 최대한 똑같이 구현하는 것이 좋음, 안될 시 재배치도 고려 도형, 그래프는 이미지 변환 후 캡션 있는 것만 읽어주기 글씨 크기 조절 기능이 있으면 좋음 다음 회의까지 할 일 - ML 이미지만 구별해 추출 만든 모델 업로드 진행과정 조사 파일 변환 흐름 조사 추출한 텍스트 파일(json 형식) tts로 돌려보기 - ..

[5주차] 회의록

피드백 정리 문제점 특정 영역을 터치해서 읽기 어려울 것 같음 특히 휴대폰에서 텍스트를 선택하기 어려울 것 같음 보이스오버/톡백 기능과의 차별화 되는 것이 중요할 것 같음 이미지에 대한 설명은 어떻게 제공할 것인지? 강의 자료는 대부분 pdf이기에 거기에 집중하는 것이 좋을 듯 보완점 텍스트 파일로도 제공 (원하는 만큼 확대 해서 읽기 편하게) 텍스트로 변환해서 큰 화면으로 제공 (피피티 화면을 그대로 재현하는 대신 텍스트를 추출해서 자유롭게 확대 가능한 텍스트 박스에 담기?) 북마크 기능 / 태그를 나눠 섹션 별로 모아보게 하는 기능 터치 없이도 처음부터 끝까지 / 특정 구간만 자료를 오디오북 처럼 읽을 수 있는 기능 터치 해서 읽는 부분은 선택사항으로 두되, 강의 자료를 넘길 때 마다 첫 문장부터 쭉..