SKT를 사용하는 경우 10월 31일까지 퍼플렉시티 프로 1년 무료 구독을 신청할 수 있습니다. 저는 며칠 전에 신청하여 테스트하고 있습니다. 인공지능(AI) 검색 엔진인 Perplexity는 구글의 대항마로 주목받으면서 아마존, 엔비디아, SKT 등 큰 기업들로부터 투자를 받고 있습니다.
https://avada.tistory.com/3491
며칠 사용해 보니 특정 주제에 대하여 요약하는 용도로 훌륭한 도구인 것 같습니다. 하지만 제시된 정보가 최신 정보가 아닐 수 있고 잘못된 출처를 사용할 경우 오류가 있을 수 있습니다.
만족스러운 검색 결과를 얻으려면 질문을 잘 해야 합니다. 최신 정보를 원한다면 검색하는 페이지/글의 발행 날짜를 제한할 수 있습니다. 그리고 특정 사이트 내에서만 검색이 가능하도록 설정하는 것도 가능합니다.
Perplexity Pro는 이미지 생성 기능도 제공합니다. 다양한 이미지 생성 모델 중에서 선택하여 이용할 수 있으므로 잘 활용하면 만족스러운 결과를 얻을 수 있지 않을까 생각됩니다.
AI 검색 엔진 퍼플렉시티 프로(Perplexity Pro)에서 제공하는 이미지 생성 모델
퍼플렉시티는 무료 버전과 프로 버전이 있으면 프로 버전에서는 이미지 생성 기능이 제공되고 파일 업로드 및 분석이 가능합니다.
이미지 생성을 담당하는 이미지 생성 모델로는 Playground v3, DALL-E 3, Stable Diffusion XL, FULX.1 등이 있습니다.
DALL-E는 챗GPT에서도 사용되고 있고 잘 알려져 있지만 나머지는 다소 생성할 수 있을 것입니다.
Playground v3 (PGv3):
- 최신 텍스트-이미지 모델로, 여러 벤치마킹에서 최고 성능을 보여주고 있다고 합니다.
- 디코더 전용 대규모 언어 모델(LLM)을 활용하여 텍스트 조건 처리
- 텍스트 프롬프트 준수, 복잡한 추론, 정확한 텍스트 렌더링에 우수함
- 스티커, 포스터, 로고 디자인 등 그래픽 디자인 능력이 뛰어남
- 정확한 RGB 색상 제어와 강력한 다국어 이해 능력을 갖추고 있음
DALL-E 3:
- OpenAI가 개발한 최신 모델
- 복잡한 텍스트 프롬프트를 정확하고 상세한 이미지로 변환
- 이전 버전보다 더 많은 뉘앙스와 세부 사항 이해
- 자연스러운 스타일과 생생한 스타일 옵션 제공
- 텍스트, 로고, 인터페이스 등을 이미지에 정확하게 포함 가능
- ChatGPT와 통합하여 프롬프트 개선과 이미지 조정 용이
Stable Diffusion XL:
- 최대 1024x1024 해상도 이미지 생성 가능
- 이전 버전보다 더 사실적이고 세밀한 이미지 생성
- 인페인팅, 아웃페인팅, 이미지-이미지 생성 지원
- 텍스트 생성 및 가독성 향상
- 35억 개의 매개변수를 가진 대규모 UNet 백본 사용
FLUX.1:
- Black Forest Labs에서 개발한 모델로, 세 가지 버전(pro, dev, schnell)이 있음
- 12억 개의 매개변수를 가진 하이브리드 아키텍처 사용
- 인체 해부학, 특히 손과 얼굴을 정확하게 렌더링하는 능력이 뛰어남
- 이미지 내 텍스트 생성 능력이 크게 향상됨
- 복잡한 프롬프트를 정확하게 따르고 다양한 이미지 생성 가능
각 모델은 나름대로의 장단점이 있으므로 사용자의 요구 사항에 따라 적절한 모델을 선택할 수 있습니다. Playground v3는 전반적인 성능과 그래픽 디자인 능력이 뛰어나고, DALL-E 3는 복잡한 프롬프트를 이해하고 ChatGPT와 통합되는 것이 강점입니다. Stable Diffusion XL은 고해상도 이미지와 다양한 이미지 조작 기능을 제공하는 한편, FLUX.1은 인체 표현과 텍스트 생성에 특화되어 있습니다.
Perplexity에서 이미지 생성하기
프플렉시티에서 이미지 생성을 테스트하고 있지만 챗GPT보다는 제어가 쉽지 않은 것 같습니다. 각 언어 모델을 선택하여 원하는 대로 그림을 그려주는 모델을 선택할 수 있을 것입니다.
먼저는 Perplexity에 질문을 한 후에 답변을 받은 다음, 오른쪽 하단의 이미지 생성을 클릭하여 이미지를 생성할 수 있습니다.
이미지 생성을 클릭하면 스타일 선택에서 그림, 사진, 일러스트, 도표를 선택할 수 있습니다.
여기에서 스타일을 선택을 하면 내가 원하는 이미지를 생성하지 않는 것 같습니다. 저는 스타일 선택 오른쪽에 있는 아이콘을 클릭하여 사용자 정의 프롬프트 화면을 표시하여 프롬프트를 지정합니다.
제출 버튼을 클릭하면 이미지 생성이 시작됩니다.
robots.txt 관련 이미지를 생성해달라고 하니 위와 같이 생성해주세요.
Perplexity에 특정 주제에 대한 그림을 그려달라고 입력하면 그림을 그려줄 수는 없지만 어떤 식으로 그릴 것인지에 대한 구체적인 설명을 예시로 제시해줄 수 있습니다. 그러한 예시를 참고하여 이미지 생성을 요청할 수 있습니다.
위와 같이 요청을 하니 다음과 같은 그림이 생성되었습니다.
챗GPT를 사용하는 것보다 원하는 이미지를 생성하는 것이 쉽지 않아 보이지만, 내가 원하는 이미지를 생성하는 최적의 방법을 찾는 시도를 하면 좋은 결과가 있을 것 같습니다.
바야흐로 AI 시대가 개막된 것 같습니다. 아직은 부족한 부분이 있지만 기술이 발전하고 AI를 운영하는 비용이 낮아지면 구글 검색 등 많은 부분을 AI로 대체되지 않을까 생각됩니다. 저는 AI 영어회화 앱인 스픽을 이용하여 영어 스피킹을 연습하고 있는데, 시간과 장소에 구애받지 않고 영어 회화 연습을 할 수 있어 비용 대비 효과적인 솔루션이라 생각됩니다.
https://avada.tistory.com/3374
참고
https://avada.tistory.com/3401