우선 아카이브에 올라온 검증안된 논문의 주장이니까 그런 의견도 있구나 하고 넘어가면 좋을 것 같음
현재 ai 모델의 성능을 향상시키는 방법은 그냥 학습 데이터셋의 양을 늘리는 거임
양은 적지만 잘 정제되고 좋은 품질의 데이터셋보다 방대한 양의 데이터셋을 학습시키는게 성능 증가에 도움이 되었음
그런데 2026~32년 사이에 인간이 만들어낸 거의 모든 텍스트 데이터를 학습 완료할 예정이라고 해
즉 더이상 학습할 데이터가 없는 거지
이미 학습한 데이터를 재활용해서 정밀도를 올릴 수 있지만 큰 도움은 안된다고 함
ai가 만든 데이터셋을 학습시키는 것도 마찬가지고...
그래서 새로운 학습 기법이 나오지 않는 이상 ai의 성능 향상은 한계를 맞이할 거라고 하네
그럼 슬슬 실전으로 들어가는건가..