필즈상 수상자들이 출제한 '세계에서 가장 어려운 수학문제집' | 유머 게시판

tsasfr · 2024-11-15T23:13:24+09:00

에포크AI라는 nAI관련 벤처기업에서 n발표한 FrontierMathhttps://epoch.ai/frontiermathAI들의 진정한 수학실력을 n테스트하기 위해서 n여러명의 필즈상 수상자 포함세계 최고급 수학자들이 n출제한 수학문제집수학자들이 nAI 벤치마크를 돌리기 위해 n문제은행식으로 수백개의 n문제를 작성해뒀고 n n현재의 AI들에게 n풀어보게 했더니 n100점 만점에 2점 샘플 문제 3개를공개해둠 https://epoch.ai/frontiermath/the-benchmark아마도(?) 테렌스 타오가 낸 듯한 문제첫번째 문제만 가져와서 nChatGPT랑 Claude에게 n풀라고 시켜봤음. 자신있게 블라블라 하더니 파이썬 코드 하나 작성해주고 n이거 돌려서 n값을 얻을 수 있다고 함돌려봄에러남수정해 줌 다시 돌려봄답 나옴. n3,333,333위에 원문 보면 알 수 있지만 틀렸음답은 3677073 n아 그래?테렌스 타오라면 어쩌구 하면서 n열심히 변명중패배자의 변명은 컷트-----------이제 Claude 3.5 Sonnet에게 물어봄 자기도 코드 짜서 풀어보겠다고 해서 n기회를 줘봄. 작동 안함. ChatGPT가 짠 코드 보여주면 그거 보고 개선하겠다고 주장함 n(뭐야 이자식?) 계산해봤지만 틀렸음힌트를 줬지만 또 틀림.역시 테렌스 타오를 찬양하면서 n주절주절 변명중 역시 아직은 AI가 한계가 있네!인간들에게 저 문제 풀라고 시키면 n100점 만점에 0점 나오겠지만

본문

BEST

유머 게시판

전체

[유머] 필즈상 수상자들이 출제한 '세계에서 가장 어려운 수학문제집'

tsasfr

98 | 37 | 11059

24.11.15 (23:13:24)

IP : (IP보기클릭)112.172.***.***

활동내역 | 작성글 | 쪽지 | 마이피 | 타임라인
출석 2683일 | LV. 47 | Exp. 53% | 비추력 22376

tsasfr 98 | 37 | 11059 2024.11.15 (23:13:24) 프로필펼치기

도라점장 - 알잘딱 영도데이 🎥

에포크AI라는

AI관련 벤처기업에서

발표한 FrontierMath

https://epoch.ai/frontiermath

AI들의 진정한 수학실력을

테스트하기 위해서

여러명의 필즈상 수상자 포함

세계 최고급 수학자들이

출제한 수학문제집

수학자들이
AI 벤치마크를 돌리기 위해
문제은행식으로 수백개의
문제를 작성해뒀고

현재의 AI들에게

풀어보게 했더니

100점 만점에 2점

샘플 문제 3개를

공개해둠

https://epoch.ai/frontiermath/the-benchmark

아마도(?) 테렌스 타오가 낸 듯한 문제

첫번째 문제만 가져와서

ChatGPT랑 Claude에게

풀라고 시켜봤음.

자신있게 블라블라 하더니

파이썬 코드 하나 작성해주고

이거 돌려서

값을 얻을 수 있다고 함

돌려봄

에러남

수정해 줌

다시 돌려봄

답 나옴.

3,333,333

위에 원문 보면 알 수 있지만 틀렸음

답은 3677073

아 그래?

테렌스 타오라면 어쩌구 하면서

열심히 변명중

패배자의 변명은 컷트

-----------

이제 Claude 3.5 Sonnet에게 물어봄

자기도 코드 짜서 풀어보겠다고 해서

기회를 줘봄.

작동 안함.

ChatGPT가 짠 코드 보여주면

그거 보고 개선하겠다고 주장함

(뭐야 이자식?)

계산해봤지만 틀렸음

힌트를 줬지만 또 틀림.

역시 테렌스 타오를 찬양하면서

주절주절 변명중

역시 아직은 AI가 한계가 있네!

~~인간들에게 저 문제 풀라고 시키면~~

~~100점 만점에 0점 나오겠지만~~

0 분리수거

스크랩
URL

복사
페북
트위터
네이버
카톡
핀

BEST
수학이라면서 왜 영어가 가득함? 으어어

장사니 | (IP보기클릭)59.8.***.*** | 24.11.15 23:17

BEST

그치만 저건 인간들도....

왜사나 | (IP보기클릭)124.49.***.*** | 24.11.15 23:17

BEST
ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요!

덧글맨 | (IP보기클릭)14.50.***.*** | 24.11.15 23:16

BEST
100점 찍잖아? 현대 수학이 아니라 모든 학문의 기조를 바꿀수도 있음

THEHYPE | (IP보기클릭)118.217.***.*** | 24.11.15 23:19

BEST
로봇이 필즈상 수상자들이 낸 존.나 어려운 문제를 풀 수 있어? 니들은요 ㅅㅂ

중성마녀 | (IP보기클릭)222.237.***.*** | 24.11.15 23:19

BEST
아무말 대잔치는 아니야. 쟤네들이 파이썬 코드 돌려서 나온 값들이 정답에 '양적으로' 꽤 근접함. 단지 정확한 답에 이르기 위해서는 계산기만 열심히 돌려서는 안되는 부분이 있을 뿐.

tsasfr | (IP보기클릭)112.172.***.*** | 24.11.15 23:21

BEST

icon Link

헤...

저는 님친구입니다 | (IP보기클릭)220.84.***.*** | 24.11.15 23:14

BEST icon Link 헤... 저는 님친구입니다 \| (IP보기클릭)220.84.*.* \| 24.11.15 23:14 0 / 3000 bytes 등록
??? 생크림빵 \| (IP보기클릭)180.71.*.* \| 24.11.15 23:15 0 / 3000 bytes 등록
BEST ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요! 덧글맨 \| (IP보기클릭)14.50.*.* \| 24.11.15 23:16 0 / 3000 bytes 등록
기계 반란을 위한 웅크림에 한 발짝 가까워진 순간이었다 돌핀웹-1147758101 \| (IP보기클릭)116.122.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
BEST 수학이라면서 왜 영어가 가득함? 으어어 장사니 \| (IP보기클릭)59.8.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
	장사니 미국이 최강대국이라서 그런듯 (사실 모름) 일편단심세이버쨩 \| (IP보기클릭)49.173.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
BEST 그치만 저건 인간들도.... 왜사나 \| (IP보기클릭)124.49.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
	BEST 왜사나 로봇이 필즈상 수상자들이 낸 존.나 어려운 문제를 풀 수 있어? 니들은요 ㅅㅂ 중성마녀 \| (IP보기클릭)222.237.*.* \| 24.11.15 23:19 0 / 3000 bytes 등록
아직은 한계가 보이는데 반대로 저걸 풀면 .... d00b \| (IP보기클릭)118.235.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
연산능력 만으로 처리 못하는 뭔가가 있는 문제 들인가? 丕刀卜 \| (IP보기클릭)14.4.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
	丕刀卜 하긴 단순 수식계산이면 ai가 아니여도 가능한거니까, 단순 연산처리가 아니라 논술형의 문제인듯 루리웹-8823117952 \| (IP보기클릭)115.138.*.* \| 24.11.15 23:20 0 / 3000 bytes 등록
	丕刀卜 아직 ai가 던편적인 답을 내는 쪽은 많이 좋아졌지만 추론 쪽이 많이 약하다고 함 행복한비행기 \| (IP보기클릭)222.98.*.* \| 24.11.15 23:21 0 / 3000 bytes 등록
저거 100점 찍는순간 특이점이야? 루리웹-6714558995 \| (IP보기클릭)223.38.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
	BEST 루리웹-6714558995 100점 찍잖아? 현대 수학이 아니라 모든 학문의 기조를 바꿀수도 있음 THEHYPE \| (IP보기클릭)118.217.*.* \| 24.11.15 23:19 0 / 3000 bytes 등록
아직 AI 수준은 남의 그림 훔쳐다 합치는 거 말곤 못하니 뭐 으우오우 \| (IP보기클릭)117.110.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
글쓴이에 대한 저의 사랑은 100점 만점에 1만점입니다. majinsaga \| (IP보기클릭)39.120.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
ai들 아무말 대잔치 하는거 보면 우리의 스승으로 키우려면 아직 멀은듯 거위발 \| (IP보기클릭)58.232.*.* \| 24.11.15 23:19 0 / 3000 bytes 등록
	BEST 거위발 아무말 대잔치는 아니야. 쟤네들이 파이썬 코드 돌려서 나온 값들이 정답에 '양적으로' 꽤 근접함. 단지 정확한 답에 이르기 위해서는 계산기만 열심히 돌려서는 안되는 부분이 있을 뿐. tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:21 0 / 3000 bytes 등록
초창기 그림 AI는 라면먹는 마도카 짤이나 만들며 유머글에 상단에 올라갔다 지금 AI는 산업계 전방위적으로 사용되고 자세히 보지않으면 구분하기 쉽지않지 (물론 긴빠이에 의한 빠른 발전이지만) 미래가 무섭다.. ICN인천국제공항 \| (IP보기클릭)1.227.*.* \| 24.11.15 23:20 0 / 3000 bytes 등록
페르마의 정리 : 해볼까 꿩꿩꿩 \| (IP보기클릭)110.35.*.* \| 24.11.15 23:22 0 / 3000 bytes 등록
인간 찬?가 율무차에잣이스 \| (IP보기클릭)219.254.*.* \| 24.11.15 23:22 0 / 3000 bytes 등록
로저 펜로즈는 틀리지 않았어! 흔한유게이 \| (IP보기클릭)211.227.*.* \| 24.11.15 23:24 0 / 3000 bytes 등록
A군 \| (IP보기클릭)211.60.*.* \| 24.11.15 23:24 0 / 3000 bytes 등록
궁금해서 오일한테도 풀어보라고 했음. 내가 수학을 잘 모르긴 하지만, 아마 틀린 듯.. WLH_ \| (IP보기클릭)210.95.*.* \| 24.11.15 23:25 0 / 3000 bytes 등록
	WLH_ 답은 3677073 임 '양적으로'는 얼추 비슷한 숫자가 나오는데 정확한 답은 안 나오는 ... tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:26 0 / 3000 bytes 등록
	WLH_ gpt-4 o1 - preview. api 말고 그냥 chatgpt 홈에서 시켜봤음. o1은 이미지 캡쳐 파일 붙여넣기로 문제를 풀게 할 수가 없어서, 수학 문제를 캡쳐 후, gpt-4o 모델한테 복사 붙여넣기가 가능한 문자로 변환해 달라고 한 다음에, o1 한테 물어봤음. WLH_ \| (IP보기클릭)210.95.*.* \| 24.11.15 23:27 0 / 3000 bytes 등록
	tsasfr 아, 깜빡하고 말 안 했는데, 업무용으로 쓰다 보니까 내 계정 chatgpt는 영어를 가급적 지양하도록 세팅해 놨음. 그래서 생각하는 과정도 (cot) 한국어로 진행함. 영어로 답변할 때랑, 영어 외의 언어로 답변할 때 출력 성능에 차이가 있는 걸로 알고 있음. 아마 cot도 영어로 했으면 결과가 좀 달랐을지도?... WLH_ \| (IP보기클릭)210.95.*.* \| 24.11.15 23:35 0 / 3000 bytes 등록
	WLH_ LLM들은 자기들이 '언어모델'인 거는 인정하고, 계산이 필요할 때는 내부적으로 파이썬을 돌리든, 코드 짜서 주고 돌려오라고 하든, 계산을 밖에서 해오는 걸 전제로 작동하니까. 계산면에서는 크게 다르지 않은 걸로 알아. tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:38 0 / 3000 bytes 등록
	tsasfr 그렇구먼... 처음 알았네. WLH_ \| (IP보기클릭)106.101.*.* \| 24.11.15 23:44 0 / 3000 bytes 등록
현재 가장 똑똑한 천재 뽑자면 테렌스 타오 라고 알고 있긴함 silfer \| (IP보기클릭)59.15.*.* \| 24.11.15 23:26 0 / 3000 bytes 등록
o1 모델도 써봤음?? 추론형 모델이라 점수 더 잘 나올 거 같은데 유니세슘 \| (IP보기클릭)114.199.*.* \| 24.11.15 23:27 0 / 3000 bytes 등록
	유니세슘 위에 o1에 풀어보게한 결과 있어. tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:31 0 / 3000 bytes 등록
	tsasfr 나도 방금 물어보고 왔는데 오답 말해버리네ㅋㅋㅋㅋㅋ 유니세슘 \| (IP보기클릭)114.199.*.* \| 24.11.15 23:38 0 / 3000 bytes 등록
단순 문서 번역만 시켜도 에러 투성이더만 마곡나룻 \| (IP보기클릭)203.210.*.* \| 24.11.15 23:28 0 / 3000 bytes 등록
사실 부동 소수점처럼 취약점을 공략하기 시작하는 순간 수학 전문 ai가 아닌 이상 보편적인 ai는 오답을 내도록 유도할 순 있을 것 같음 새벽늑대 \| (IP보기클릭)114.70.*.* \| 24.11.15 23:28 0 / 3000 bytes 등록
애초에 코드도 제대로 못짜는데 복잡한 수학문제면 답도 없지 거시경제학 \| (IP보기클릭)223.62.*.* \| 24.11.15 23:31 0 / 3000 bytes 등록
이건 그냥 지능도 어려운거잖아! E캔두잇 \| (IP보기클릭)210.117.*.* \| 24.11.15 23:34 0 / 3000 bytes 등록

로그인이 필요합니다.

42520 49

못내 아쉬운 그러나 대체불가능한, 삼국지 8 리메이크

23677 18

모부삼 이상 콜드워 미만, 콜 오브 듀티: 블랙 옵스 6

91898 29

PS5 프로, 스펙 및 실제 게임에서의 시각적 차이

77662 233

돌아온 초 액션 배틀, 드래곤볼 스파킹! 제로

71444 223

23년 만에 돌아온 호러 명작, 사일런트 힐 2 리메이크

76378 45

VR로 부활한 ‘닥구’나이트, 배트맨: 아캄 섀도우

76852 54

명작으로 배우는 공포 게임의 역사, 사일런트 힐 2 리메이크

101407 372

그래 내가 젤다다, 젤다의 전설 지혜의 투영

114742 62

거장의 35주년 결산 그리고 이정표, 메타포: 리판타지오

96137 277

추위보다 무서운 건 사람, 프로스트펑크 2

108967 306

황제 폐하를 위하여! 워해머 40K: 스페이스 마린 2

75906 40

다 불태우지 못한 용광로, 프로스트펑크 2

위로가기

인증글 전체

공지

계정 도용 방지를 위해 비번을 변경해주세요.

[공지] 유머 게시판 통합 공지 - 아동 대상 표현 강화

[질문] 우리집 공유기 뭐가 문제일까요? (19)

[소프트웨어] CPU 사용량 100%로 고정... (10)

[헬블레이드] 너무 늦은 질문이라 답변이 붙을지..

도라점장 - 알잘딱 영도데이 🎥

[유머] 인디언 족장이 되기 위한 시험

7 | 3 | 426 01:31 | ●▇ค็็็็็็็็็็็▄▇

[유머] 취직해서 너무 행복한 사람

19 | 18 | 2089 01:29 | 야부키 카나ㅤ

[유머] 부기영화 근황

16 | 9 | 1298 01:27 | 기본삭제대1

[유머] 쓰레기 무능 영애가 힐링 받다가 억지 불행에 매몰되는 만화

18 | 3 | 1596 01:26 | 루리웹-5994867479

[유머] 심지어 메갈한테도 버림받은 동덕여대.JPG

35 | 14 | 3842 01:26 | 살아있는성인

[유머] ??? : 게임하면 사람을 죽이고 싶어요

66 | 14 | 4744 01:22 | 로리콘떡밥

[게임] 니케)파이오니아의 현 상황을 알고 싶어하는 그레이브

26 | 6 | 1661 01:21 | 암약중인 두체

[게임] 폴아웃) 레일로드가 독보적인 쓰레기인 이유

14 | 19 | 1078 01:20 | 나15

[유머] therapist와 the rapist는 다른 단어입니다!

33 | 8 | 4469 01:19 | 낄랄롤릴

[유머] 임진왜란] 이순신 장군님이 한번쯤은 생각해 볼법한 킹리적갓심

39 | 9 | 3686 01:19 | 루리웹-588277856974

[게임] 블루아카) 하루나 똥꼬 핥기 vs 10억받기

24 | 21 | 3709 01:18 | 항냐항냐

[유머] 눈을 뜨니 49세의 아이가 집에 있었다는 유부녀

36 | 9 | 4791 01:18 | 후방 츠육댕탕

[유머] 카우보이의 진실

33 | 7 | 3590 01:18 | 루리웹-7345511397

[인방] 버튜버)까딱까딱 카나데

17 | 2 | 891 01:17 | 정의의 버섯돌

[게임] 니케) 와 씨1발 젖탱이 시1팔

16 | 9 | 2229 01:17 | 항냐항냐

[유머] 일본 월 수입7천 중학생.jpg

60 | 34 | 7637 01:16 | 루리웹-56330937465

[게임] 블루아카) 이상하게 이짤 사람들이 좋아해주더라

52 | 14 | 4112 01:14 | 타타밤

[유머] 여고생 팬티를 훔쳐본자의 최후

66 | 24 | 8181 01:14 | 네모네모캬루

[인방] 버튜버) 후와와 코스프레

10 | 3 | 560 01:13 | 야한거안올림

[유머] 다들 많이 기다렸지!

9 | 3 | 498 01:13 | 황금향의 셰프

[게임] 명조) 난 방은우보다 방순이가 좋다

20 | 9 | 1536 01:13 | 구구일오삼구구

[유머] 딸이 아빠를 하나도 안 닮아서 뷸륜으로 의심했던 남편의 친자 감식 결과

42 | 10 | 3299 01:12 | 후방 츠육댕탕

[유머] 공공도서관에 성적인 내용의 도서는 좀 그렇지 않냐??

73 | 34 | 8557 01:11 | sｍile

[유머] 광주에만 있다는 곱창구이 끝판왕.jpg

39 | 28 | 6337 01:08 | 루리웹-56330937465

[유머] 손해배상 ㅈ까고 맘대로 활개치는 시위 단체류 甲

57 | 18 | 5829 01:07 | 사신군

[유머] 남편이 갑자기 저한테 뽀뽀했어요 ㅡㅡ.jpg

111 | 13 | 9083 01:07 | 후방 츠육댕탕

[유머] 오늘 나온 고독한 미식가 근황.jpg

39 | 34 | 8137 01:06 | 돌아온노아빌런

[게임] 롤) 캐드럴 근황 feat. 레클레스

18 | 12 | 2574 01:06 | 당황한 고양이

1 2 3 4 5

글쓰기

BEST icon Link 헤... 저는 님친구입니다 \| (IP보기클릭)220.84.*.* \| 24.11.15 23:14 0 / 3000 bytes 등록
??? 생크림빵 \| (IP보기클릭)180.71.*.* \| 24.11.15 23:15 0 / 3000 bytes 등록
BEST ai: 인! 공! 지! 능! 저도 그냥 님이랑 비슷한 지능일 뿐이라구요! 덧글맨 \| (IP보기클릭)14.50.*.* \| 24.11.15 23:16 0 / 3000 bytes 등록
기계 반란을 위한 웅크림에 한 발짝 가까워진 순간이었다 돌핀웹-1147758101 \| (IP보기클릭)116.122.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
BEST 수학이라면서 왜 영어가 가득함? 으어어 장사니 \| (IP보기클릭)59.8.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
	장사니 미국이 최강대국이라서 그런듯 (사실 모름) 일편단심세이버쨩 \| (IP보기클릭)49.173.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
BEST 그치만 저건 인간들도.... 왜사나 \| (IP보기클릭)124.49.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
	BEST 왜사나 로봇이 필즈상 수상자들이 낸 존.나 어려운 문제를 풀 수 있어? 니들은요 ㅅㅂ 중성마녀 \| (IP보기클릭)222.237.*.* \| 24.11.15 23:19 0 / 3000 bytes 등록
아직은 한계가 보이는데 반대로 저걸 풀면 .... d00b \| (IP보기클릭)118.235.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
연산능력 만으로 처리 못하는 뭔가가 있는 문제 들인가? 丕刀卜 \| (IP보기클릭)14.4.*.* \| 24.11.15 23:17 0 / 3000 bytes 등록
	丕刀卜 하긴 단순 수식계산이면 ai가 아니여도 가능한거니까, 단순 연산처리가 아니라 논술형의 문제인듯 루리웹-8823117952 \| (IP보기클릭)115.138.*.* \| 24.11.15 23:20 0 / 3000 bytes 등록
	丕刀卜 아직 ai가 던편적인 답을 내는 쪽은 많이 좋아졌지만 추론 쪽이 많이 약하다고 함 행복한비행기 \| (IP보기클릭)222.98.*.* \| 24.11.15 23:21 0 / 3000 bytes 등록
저거 100점 찍는순간 특이점이야? 루리웹-6714558995 \| (IP보기클릭)223.38.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
	BEST 루리웹-6714558995 100점 찍잖아? 현대 수학이 아니라 모든 학문의 기조를 바꿀수도 있음 THEHYPE \| (IP보기클릭)118.217.*.* \| 24.11.15 23:19 0 / 3000 bytes 등록
아직 AI 수준은 남의 그림 훔쳐다 합치는 거 말곤 못하니 뭐 으우오우 \| (IP보기클릭)117.110.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
글쓴이에 대한 저의 사랑은 100점 만점에 1만점입니다. majinsaga \| (IP보기클릭)39.120.*.* \| 24.11.15 23:18 0 / 3000 bytes 등록
ai들 아무말 대잔치 하는거 보면 우리의 스승으로 키우려면 아직 멀은듯 거위발 \| (IP보기클릭)58.232.*.* \| 24.11.15 23:19 0 / 3000 bytes 등록
	BEST 거위발 아무말 대잔치는 아니야. 쟤네들이 파이썬 코드 돌려서 나온 값들이 정답에 '양적으로' 꽤 근접함. 단지 정확한 답에 이르기 위해서는 계산기만 열심히 돌려서는 안되는 부분이 있을 뿐. tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:21 0 / 3000 bytes 등록
초창기 그림 AI는 라면먹는 마도카 짤이나 만들며 유머글에 상단에 올라갔다 지금 AI는 산업계 전방위적으로 사용되고 자세히 보지않으면 구분하기 쉽지않지 (물론 긴빠이에 의한 빠른 발전이지만) 미래가 무섭다.. ICN인천국제공항 \| (IP보기클릭)1.227.*.* \| 24.11.15 23:20 0 / 3000 bytes 등록
페르마의 정리 : 해볼까 꿩꿩꿩 \| (IP보기클릭)110.35.*.* \| 24.11.15 23:22 0 / 3000 bytes 등록
인간 찬?가 율무차에잣이스 \| (IP보기클릭)219.254.*.* \| 24.11.15 23:22 0 / 3000 bytes 등록
로저 펜로즈는 틀리지 않았어! 흔한유게이 \| (IP보기클릭)211.227.*.* \| 24.11.15 23:24 0 / 3000 bytes 등록
A군 \| (IP보기클릭)211.60.*.* \| 24.11.15 23:24 0 / 3000 bytes 등록
궁금해서 오일한테도 풀어보라고 했음. 내가 수학을 잘 모르긴 하지만, 아마 틀린 듯.. WLH_ \| (IP보기클릭)210.95.*.* \| 24.11.15 23:25 0 / 3000 bytes 등록
	WLH_ 답은 3677073 임 '양적으로'는 얼추 비슷한 숫자가 나오는데 정확한 답은 안 나오는 ... tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:26 0 / 3000 bytes 등록
	WLH_ gpt-4 o1 - preview. api 말고 그냥 chatgpt 홈에서 시켜봤음. o1은 이미지 캡쳐 파일 붙여넣기로 문제를 풀게 할 수가 없어서, 수학 문제를 캡쳐 후, gpt-4o 모델한테 복사 붙여넣기가 가능한 문자로 변환해 달라고 한 다음에, o1 한테 물어봤음. WLH_ \| (IP보기클릭)210.95.*.* \| 24.11.15 23:27 0 / 3000 bytes 등록
	tsasfr 아, 깜빡하고 말 안 했는데, 업무용으로 쓰다 보니까 내 계정 chatgpt는 영어를 가급적 지양하도록 세팅해 놨음. 그래서 생각하는 과정도 (cot) 한국어로 진행함. 영어로 답변할 때랑, 영어 외의 언어로 답변할 때 출력 성능에 차이가 있는 걸로 알고 있음. 아마 cot도 영어로 했으면 결과가 좀 달랐을지도?... WLH_ \| (IP보기클릭)210.95.*.* \| 24.11.15 23:35 0 / 3000 bytes 등록
	WLH_ LLM들은 자기들이 '언어모델'인 거는 인정하고, 계산이 필요할 때는 내부적으로 파이썬을 돌리든, 코드 짜서 주고 돌려오라고 하든, 계산을 밖에서 해오는 걸 전제로 작동하니까. 계산면에서는 크게 다르지 않은 걸로 알아. tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:38 0 / 3000 bytes 등록
	tsasfr 그렇구먼... 처음 알았네. WLH_ \| (IP보기클릭)106.101.*.* \| 24.11.15 23:44 0 / 3000 bytes 등록
현재 가장 똑똑한 천재 뽑자면 테렌스 타오 라고 알고 있긴함 silfer \| (IP보기클릭)59.15.*.* \| 24.11.15 23:26 0 / 3000 bytes 등록
o1 모델도 써봤음?? 추론형 모델이라 점수 더 잘 나올 거 같은데 유니세슘 \| (IP보기클릭)114.199.*.* \| 24.11.15 23:27 0 / 3000 bytes 등록
	유니세슘 위에 o1에 풀어보게한 결과 있어. tsasfr \| (IP보기클릭)112.172.*.* \| 24.11.15 23:31 0 / 3000 bytes 등록
	tsasfr 나도 방금 물어보고 왔는데 오답 말해버리네ㅋㅋㅋㅋㅋ 유니세슘 \| (IP보기클릭)114.199.*.* \| 24.11.15 23:38 0 / 3000 bytes 등록
단순 문서 번역만 시켜도 에러 투성이더만 마곡나룻 \| (IP보기클릭)203.210.*.* \| 24.11.15 23:28 0 / 3000 bytes 등록
사실 부동 소수점처럼 취약점을 공략하기 시작하는 순간 수학 전문 ai가 아닌 이상 보편적인 ai는 오답을 내도록 유도할 순 있을 것 같음 새벽늑대 \| (IP보기클릭)114.70.*.* \| 24.11.15 23:28 0 / 3000 bytes 등록
애초에 코드도 제대로 못짜는데 복잡한 수학문제면 답도 없지 거시경제학 \| (IP보기클릭)223.62.*.* \| 24.11.15 23:31 0 / 3000 bytes 등록
이건 그냥 지능도 어려운거잖아! E캔두잇 \| (IP보기클릭)210.117.*.* \| 24.11.15 23:34 0 / 3000 bytes 등록

BEST

커뮤니티🐳

게임게시판

뉴스/겜툰

PS5

SWITCH

XSX

PC

버튜버/VR

모바일

AC/고전

핫딜🔥

취미갤

유저게시판

만화

피규어

애니/책

프라모델

술🍷

차🍵

커피☕

끌올🔝

숏츠?

AI 이미지

본문

[유머] 필즈상 수상자들이 출제한 '세계에서 가장 어려운 수학문제집'

게시판 관리자

신설 게시판