Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

몇몇 서비스를 시도해봤는데 텍스트로 그림을 설명하는데 익숙하지 않아서인지 기사에서 봤던 그럴듯한 이미지를 만들어낼 수가 없었습니다. 무료로 제공되는 횟수를 순식간에 소진했는데 단순히 학습용으로 사용하기 위해 비용을 지불하고 싶지는 않았습니다. 그러다가 How to Run Stable Diffusion on Your PC to Generate AI Images를 보니 내 기계에서 모델 중 하나를 돌려볼 수 있는 절차를 절 정리해 놓고 있어 환경을 구축하고 내 기계에서 횟수 제한 없이 모델을 돌려볼 수 있게 되었습니다.

...

횟수 제한 없이 마음 놓고 이것 저것 시도해보면서 처음 받은 느낌은 아이폰 4S가 나온 다음 시리에게 이것 저것 말을 걸며 시리에게 올바른 명령을 내리는 방법을 습득하던 것과 비슷하다는 것이었습니다. 시리가 처음 나올 때 지금은 잘리고 없는 SVP가 광고에 나와 말의 의미를 이해한다고 주장했지만 이게 좀 심한 과장 광고였음을 아이폰을 새로 받은 뒤 몇 시간 만에 알게 되었습니다.

...

그림을 생성하는 기계학습 모델에게 말을 걸며 가장 크게 느낀 점은 내 모릿속에 머릿속에 떠올린 이미지를 기계에게 설명하기 위해서는 주로 시각적인 언어에 집중해 설명해야 한다는 것입니다. 처음에는 머릿속에 떠오른 이미지를 ‘넓은 호수’나 ‘커다란 산’처럼 대상의 시각적인 형태를 표현하는 대신 사람만 알고 있는 단어로 표현했습니다. 당연히 결과는 그리 만족스럽지 않았고요. 기계는 내가 말한 어떤 단어는 반영한 듯 보였지만 어떤 단어는 완전히 무시했는데 주로 시각적이지 않은 단어가 더 자주 무시되는 것 같아 보였고 이에 맞춰 그림을 설명하는 방식을 조금씩 개선했습니다. 시각적인 언어에 중점을 두고 전경을 차지할 대상을 묘사하고 후경으로 이동하며 시각적 특징을 묘사하면 어느 정도 예상할 수 있는 이미지를 얻을 수 있었습니다.

...