OCR + LLM 학습으로 스스로 필요한 텍스트 부분을 인식하고 읽게 하는거...
장기적으로 봤을때 비쥬얼 노블 장르의 게임같은거 방송 할때 쓸려고 만든걸로 보이죠
이미 슬레이 더 프린세스 라던가 그런 장르의 게임한적이 있는데 그때는 일일히 비달이 다 읽어서 들려줬는데
이게 좀 더 빠르고 정밀해지면 스스로 화면 속 텍스트를 읽고 선택지 고르는 것 정도는 가능하지 않을까 싶기도?
이미 그림 정도는 쉽게 구분하기 시작했으니
당장 아트 리뷰 스트림이나 오늘 dev 스트림에서 그림이나 사진은 꽤나 세부적으로 인식하는걸 보여줬고...
그런건 둘째치고 비달 뿌듯해 하는거 보면 저 맛으로 개발 방송하는거 같긴합니다 ㅋㅋ
비달은 대체 컴퓨터 얼마나 사양이 좋은 걸까요 트위치에 적어둔 사양은 스트리밍용 컴퓨터 사양 같던데.. 뉴로 + 여러모듈 다 돌릴려면 4090 한 개로는 힘들 것 같은데..
아직도 2시간 정도 켜두면 뻗는다고 공공연히 얘기하는걸 봐선 기본적 사양은 그렇게 높은거 같진 않더군요 근데 NN에서 말하기론 클라우드 컴퓨팅으로 굴리는 경우도 있는거 같다고 추측하시는 분도 있긴 하더군요
비달은 대체 컴퓨터 얼마나 사양이 좋은 걸까요 트위치에 적어둔 사양은 스트리밍용 컴퓨터 사양 같던데.. 뉴로 + 여러모듈 다 돌릴려면 4090 한 개로는 힘들 것 같은데..
아직도 2시간 정도 켜두면 뻗는다고 공공연히 얘기하는걸 봐선 기본적 사양은 그렇게 높은거 같진 않더군요 근데 NN에서 말하기론 클라우드 컴퓨팅으로 굴리는 경우도 있는거 같다고 추측하시는 분도 있긴 하더군요