본문

[유머] AI 사진생성 프롬프트에서 새로 발견된 것

profile_image
일시 추천 조회 8963 댓글수 29 프로필펼치기

2 분리수거

1

댓글 29
BEST
그 반대임. 모델을 학습시키는 사람이 저 프롬프트를 학습 시켰기 때문에 생성시에 그런 이미지가 나오는 거임
루리웹-9965811904 | (IP보기클릭)221.140.***.*** | 24.10.13 16:56
BEST
ai라고 말안하면 걍 사진 인데..?
파랑사슴 | (IP보기클릭)211.250.***.*** | 24.10.13 16:55
nana111 | (IP보기클릭)125.184.***.*** | 24.10.13 16:54
BEST
니콘 로파일 확장자 넣어보자 색감 변하는지
毛부리 | (IP보기클릭)121.180.***.*** | 24.10.13 16:55
BEST
뭔 소리지... AI모델이 학습한 원본 사진을 뱉는 과적합 그 자체인데...
鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:07
BEST
확장자만? 아님 진짜 색정보도 갖고 있는거??
Marshawn Lynch | (IP보기클릭)126.157.***.*** | 24.10.13 16:55
BEST
첫번째 이미지 속 여성이 가공된 이미지라고..?
昊天罔極 | (IP보기클릭)58.124.***.*** | 24.10.13 17:02
nana111 | (IP보기클릭)125.184.***.*** | 24.10.13 16:54
BEST

ai라고 말안하면 걍 사진 인데..?

파랑사슴 | (IP보기클릭)211.250.***.*** | 24.10.13 16:55
BEST

니콘 로파일 확장자 넣어보자 색감 변하는지

毛부리 | (IP보기클릭)121.180.***.*** | 24.10.13 16:55
BEST

확장자만? 아님 진짜 색정보도 갖고 있는거??

Marshawn Lynch | (IP보기클릭)126.157.***.*** | 24.10.13 16:55
BEST

그 반대임. 모델을 학습시키는 사람이 저 프롬프트를 학습 시켰기 때문에 생성시에 그런 이미지가 나오는 거임

루리웹-9965811904 | (IP보기클릭)221.140.***.*** | 24.10.13 16:56
루리웹-9965811904

그냥 그림ai 작가나 작품명 프롬프트 넣는 거랑 비슷한 거 아님?

햄즈 | (IP보기클릭)182.210.***.*** | 24.10.13 17:01
BEST

첫번째 이미지 속 여성이 가공된 이미지라고..?

昊天罔極 | (IP보기클릭)58.124.***.*** | 24.10.13 17:02
昊天罔極

이빨 가운데 빈거 보면 ai 이미지인듯 스테이블 디퓨전 체크포인트 중에 저런 부작용 나타나는 게 있음 ㅋㅋ

engineer gaming | (IP보기클릭)118.130.***.*** | 24.10.13 17:03

사진 메타데이터 렌즈 종류나 화질정보 같은걸 프롬프트에 넣으면 좀 더 사실적으로 변함 ㅋㅋㅋㅋ

engineer gaming | (IP보기클릭)118.130.***.*** | 24.10.13 17:02

걍 학습된 사진 원본이 튀어나오는 거구만... 흔히 있는 일임

鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:02
鶏胸肉

과적합이라고 부르는 현상인데 막으려면 데이터 셋의 스케일을 늘려야함. 안 그러면 계속 원본 사진을 뱉어버림

鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:06
鶏胸肉

알못이면 댓글을 안다는게 좋다

루리웹-9778766951 | (IP보기클릭)14.42.***.*** | 24.10.13 17:06
鶏胸肉

그림 생성 ai는 그런 원리로 작동하는게 아닐텐데...

Vault | (IP보기클릭)222.235.***.*** | 24.10.13 17:07
BEST
루리웹-9778766951

뭔 소리지... AI모델이 학습한 원본 사진을 뱉는 과적합 그 자체인데...

鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:07
Vault

그림 생성 AI는 수없이 많은 사진을 합성한 후 재조합하는 원리임

鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:07
Vault

그림 생성 신경망 모델은 Stable Diffusion을 사용하는데 쉽게 설명하면 그림을 노이즈로 없애는 함수의 역함수를 사용함. 노이즈로부터 다시 원본 사진을 추정하는 함수인 거지.

鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:09
鶏胸肉

문제는 원본 사진을 가지고 학습시킬 수밖에 없기에 스케일이 적을 수록 과적합이 일어나 원본 사진이 튀어나옴... SD 모델에서 생성된 배들이 다 똑같이 생겼다거나

鶏胸肉 | (IP보기클릭)59.17.***.*** | 24.10.13 17:10
루리웹-9778766951

아니 쟤말이 맞아 Ai도 생성한계에도달하면 똑같은 이미지 뱉어내거나, 원본이 거의 가공되지않은 상태가 튀어나오기도 해 대표적인 증상이 원본이미지의 워터마크가 생성 이미지에 찍히는거야

루리웹-9965811904 | (IP보기클릭)211.235.***.*** | 24.10.13 17:11
鶏胸肉

그게 어떻게 합성을 하는거임 합성하는 방식이 아니라 데이터를 학습해 패턴을 얻은 후 그 정보를 바탕으로 새로운 이미지를 만들어내는거지 님이 말한 원리 대로라면 원본이 튀어나올 수가 없지

Vault | (IP보기클릭)222.235.***.*** | 24.10.13 17:12
Vault

님이 설명하려는 원리로 사진을 만드려면 인공지능이 진정으로 세상을 이해해야 함

깡계죄수 | (IP보기클릭)221.143.***.*** | 24.10.13 17:23
깡계죄수

ㄴㄴ 아님 그림 생성 ai 원리 자체는 윗님이 말한 노이즈에서 역함수를 이용해서 새로운 이미지를 생성하는 원리가 맞음 근데 이 과정을 합성이라고 할 수 가 없다는 것임 고양이 그림을 생성한다면 학습한 데이터가 된 고양이 원본 이미지에서 고양이 눈, 고양이 귀, 고양이 몸을 따와서 붙혀놓기를 하는게 아니라 그것들을 만들어내는 패턴(랜덤한 노이즈에서 이미지를 복원하는 역함수)을 이용해 새로운 고양이 이미지를 생성하는거임 여기서 그림 생성ai가 고양이를 이해하고 있냐는 중요하지 않음

Vault | (IP보기클릭)222.235.***.*** | 24.10.13 17:31
Vault

새로운 이미지에 대한 정의가 조금 다른듯 a+b를 합성해서 ab가 나온다 = 새로운 이미지가 맞음. 근데 원본 a와 원본 b를 무한으로 제네레이팅하다보면 a의 특성이 사라지거나, b의 특성이 사라진 이미지가 나올 때가 있음. 또는 전혀 다른 c라는 결과를 내놓을 때도 있음. 그게 LLM기반 AI 이미지 생성기의 특징인데... chatgpt에게도 비슷한 현상이 일어날 때가 있어 새로운걸 창조해달라는 질문을 반복하면, 몇번은 새로운 글을 내 놓지만 결국은 몇번 회전하면 똑같은 결과가 나옴. 같은 원리야

루리웹-9965811904 | (IP보기클릭)221.140.***.*** | 24.10.13 17:41
루리웹-9965811904

님 설명도 맞는데, 내가 하고 싶은 말은 1. 이미지 생성 ai는 '합성'이라는 원리로 이미지를 생성해내는게 아니라 학습된 이미지 생성 패턴을 갖고 이미지를 생성하는 것이다. 2. 그렇기에 원본 이미지의 특성을 과하게 따라하는 이미지를 생성할 가능성은 충분히 있지만 원본 그대로 생성해낼 가능성은 사실상 불가능할 만큼 적다. 이거임

Vault | (IP보기클릭)210.103.***.*** | 24.10.13 17:50
Vault

아니 사실상 불가능이 아니라 실제로 ai 제네레이팅하다보면 원본 소스를 그대로 뽑아내는 경우가 은근히 나온다니까... 확률적으로 적은건 맞는데 불가능한 수준까진 아니야

루리웹-9965811904 | (IP보기클릭)221.140.***.*** | 24.10.13 17:59
루리웹-9965811904

동일한 이미지를 같은 캡션으로 여러 번 학습하면 프롬프트 입력만으로 학습된 이미지와 유사한 결과물을 생성하는 경우도 있습니다. 하지만 이 경우에는 10~20장 수준이 아니라 수천 장이 중복될 필요가 있습니다. 연구 결과에 따르면 스테이블 디퓨전 1.5 기준으로 데이터셋인 수억장의 이미지로 구성된 Laion에서 가장 많이 중복된 35만장의 이미지&캡션을 사용해 이미지를 생성했고, 이중 약 94장의 이미지에서 복제가 발생했다고 합니다. 다만 본문에 소개된 케이스는 과학습된 이미지를 복제한 것이 아니라 이미지 파일 이름 형태의 캡션으로 학습된 이미지가 많아서 비슷한 형식의 텍스트 프롬프트가 작동한 경우 같네요.

동생대신 | (IP보기클릭)220.73.***.*** | 24.10.13 18:05

와..소름

큰상어 | (IP보기클릭)118.35.***.*** | 24.10.13 17:03

원래 이미지 생성시에 카메라 관련 프롬프트는 들어갔음 초점거리, 셔터스피드, 화각 등 파일 확장자는 좀 의외네

네모네모 고먐미 | (IP보기클릭)59.26.***.*** | 24.10.13 17:04

빨간별?! AI 이 자식 본색을 드러냈구나!

kakao99 | (IP보기클릭)106.101.***.*** | 24.10.13 17:14

이젠 진짜 구분 안가네

플오입문자 | (IP보기클릭)221.145.***.*** | 24.10.13 17:52
댓글 29
1
위로가기
범성애자 | 추천 123 | 조회 18253 | 날짜 2024.10.13
살_랑 | 추천 156 | 조회 12707 | 날짜 2024.10.13
루리웹-5187461865 | 추천 4 | 조회 226 | 날짜 2024.10.13
사격중지 | 추천 3 | 조회 174 | 날짜 2024.10.13
에너존큐브 | 추천 1 | 조회 183 | 날짜 2024.10.13
묻지말아줘요 | 추천 3 | 조회 299 | 날짜 2024.10.13
리넷겅듀 | 추천 0 | 조회 108 | 날짜 2024.10.13
Phenex | 추천 214 | 조회 46140 | 날짜 2024.10.13
LEE나다 | 추천 3 | 조회 666 | 날짜 2024.10.13
st_freedom | 추천 1 | 조회 99 | 날짜 2024.10.13
유그드라__ | 추천 1 | 조회 113 | 날짜 2024.10.13
정신세상 | 추천 4 | 조회 210 | 날짜 2024.10.13
안면인식 장애 | 추천 82 | 조회 24933 | 날짜 2024.10.13
쩌곰 | 추천 9 | 조회 218 | 날짜 2024.10.13
BoomFire | 추천 1 | 조회 275 | 날짜 2024.10.13
나15 | 추천 21 | 조회 3871 | 날짜 2024.10.13
아슈와간다 | 추천 1 | 조회 77 | 날짜 2024.10.13
갓트루참얼티밋여신블랑 | 추천 4 | 조회 254 | 날짜 2024.10.13
토코♡유미♡사치코 | 추천 0 | 조회 122 | 날짜 2024.10.13
맥도날드버거 만만세 | 추천 5 | 조회 425 | 날짜 2024.10.13
루리웹-7345511397 | 추천 2 | 조회 97 | 날짜 2024.10.13
산악회장 마속 | 추천 1 | 조회 133 | 날짜 2024.10.13
간다무간다무 | 추천 2 | 조회 114 | 날짜 2024.10.13
Exhentai | 추천 2 | 조회 108 | 날짜 2024.10.13
강등 회원 | 추천 80 | 조회 14668 | 날짜 2024.10.13
이누가미 소라🥐🍙🐻🔥 | 추천 1 | 조회 93 | 날짜 2024.10.13
루리웹-588277856974 | 추천 58 | 조회 10177 | 날짜 2024.10.13
팬텀페인 | 추천 0 | 조회 63 | 날짜 2024.10.13


글쓰기
유머 BEST
힛갤
오른쪽 BEST