본문 바로가기

전체 글

(31)
Stable Diffusion WebUI 1.5 version 사용법 정리 (Textual inversion에 초점 맞춰서) How To Do Stable Diffusion Textual Inversion (TI) / Text Embeddings By Automatic1111 Web UI Tutorial - YouTube *** 나는 WebUI가 이미 깔려 있다는 전제 하에 시작. 이 과정은 protogen과 2.1 버전에서도 적용 가능하다고 합니다 하하 stable-diffusion-webui 파일 > webui-user 배치파일 복사! > 복사본 우클릭 > 편집 이렇게 뜨는거 확인. 이렇게 추가. Command Line Arguments and Settings · AUTOMATIC1111/stable-diffusion-webui Wiki (github.com) Command Line Arguments and Settings..
인공지능 코딩 파이썬 공부 Day 1 파이썬 코딩 기초 개념 1. Big picture of this content (1) Standard Library (2) Numpy (3) Panda (4) Visualization Matplotlib/Seaborn Standard Library만 사용하면 데이터적인 측면에서 비효율적일수 있어서 Numpy 만듦. Numpy는 숫자에 특화. Pandas는 패널 데이터에 대해 특화. Matplotlib/Seaborn은 시각화에 특화. Identifiers(식별자) : 변수 이름 (class, function 등 새로 만들 때 이름 지정) * class > 대문자, function > 소문자, variables > 소문자 (일반적인 관습, 안지켜도 상관없긴함) 키워드(주제어) : 이미 파이썬에서 사용되는 특..
Attend-and-Excite: Attention-Based Semantic Guidance for Text-to-Image Diffusion Models 논문 리뷰 Abstract 현재의 T2I 모델은 탁월한 능력을 보여주지만, 의미를 완전히 전달하는 이미지를 생성하는데는 여전히 실패할 확률이 있다. 이 논문에서는 공개젹으로 사용 가능한 Stable Diffusion을 분석하고, 이를 이용하여 입력 프롬프트에서 하나 이상의 주제를 생성하지 못하는 catastrophic neglect를 평가한다. 또한 모델이 해당 주제의 속성(예를 들어 색깔과 같은)을 올바르게 bind하지 못한다는 일부 케이스를 발견했다. 이러한 실패를 줄이기 위해 이 논문에서는 생성된 이미지의 fidelity를 향상시키기 위해 inference time동안 신속하게 생성 프로세스에 개입하는 것을 추구하는 Generative Semantic Nursing(GSN)이라는 개념을 소개한다. Attend..
FID, IS, precision, recall, PSNR, SSIM, LPIPS High-Resolution Image Synthesis with Latent Diffusion Models 논문을 보면서 여기서는 FID 점수만 쓰고 여기서는 log FID 점수를 쓰고 여기서는 LPIPS 사용 여기서는 PSNR SSIM 사용 여기서는 FID, Prec, recall 을 모두 쓰는데 이러한 차이점은 무엇인지 호기심이 생겨 조사 시작 프레쳇 인셉션 거리 (Frechet Inception distance, FID)를 사용해 GANs 평가하는 법은 무엇인가요? – Weights & Biases (wandb.ai) 프레쳇 인셉션 거리 (Frechet Inception distance, FID)를 사용해 GANs 평가하는 법은 무엇인가요? 이번 리포트에서는 GAN 평가의 까다로운 부분들(gotc..
High-Resolution Image Synthesis with Latent Diffusion Models 논문 리뷰 A-1. Probability and Likelihood - Machine Learning 강의노트 (wikidocs.net) What are Stable Diffusion Models and Why are they a Step Forward for Image Generation? | by J. Rafid Siddiqui, PhD | Towards Data Science What are Stable Diffusion Models and Why are they a Step Forward for Image Generation? An Easy Guide to Latent Diffusion Models towardsdatascience.com semantic segmentation의 목적과 대표 알고리즘 FCN..
An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion 논문 리뷰 이 논문은 개인적으로 읽을 일이 생겨서.. 읽기 시작햇는데 파파고에서 조금 어려운 말을 내 식으로 해석하고 내가 모르는 이론들을 추가로 더 조사한 정도다 대충 읽어서는 이해가 안돼서 진짜 한문단한문단 번역해서 쓸데없는 내용까지 있을수도. 중간중간 영어로 쓴 부분은 내가 공부하면서는 무슨느낌인지는 이해했지만 한글로 표현하기는 어려운.. 단순히 어휘력에 한계를 느껴 영어로 표시함 Abstract Text-to-image 모델은 자연어를 통해서 이전에 없던 창조적인 자유를 제공한다. 그러나 이 자유가 어떻게 특정한 독특한 개념의 이미지를 생성하는지, 또는 새로운 역할과 장면에서 구성하는지는 불분명하다. 이 논문에서는 그런 창조적인 자유를 허가하는 심플한 접근법을 제공하는데, 객체 또는 스타일과 같이 사용자가 ..
Kaggle 정리 [K-Fold 교차 검증] 과적합과 같은 데이터 편중을 막기 위해서 별도의 세트로 구성된 학습 데이터 세트와 검증 데이터 세트에서 학습과 평가를 수행 n_splits : 분할할 세트의 갯수, 1세트만 test데이터로 사용. 나머지는 train 데이터 shuffle : True로 설정할 경우 데이터셋 내의 순서를 섞어서 샘플링. False로 설정할 경우 순서대로 분할 random_state : 특정 정수로 지정 시 샘플링 결과 고정 [Optuna] 하이퍼 파라미터 최적화 task를 도와주는 프레임워크. 파라미터의 범위 지정, 혹은 파라미터가 될 수 있는 목록을 설정하면 매 trial마다 파라미터를 변경하면서 최적의 파라미터를 찾는다. optuna는 study 개체를 기반으로 한다. 이 개체에는 필요한 파라..
Textual inversion 하는 과정 (실패후 성공!) 일단 stable diffusion webui는 깔아둠 * 다시 시작할때 webui batch 눌러서 링크 받고 시작하는거 잊지말기 (10) TEXTUAL INVERSION - How To Do It In Stable Diffusion (It's Easier Than You Think) + Files!!! - YouTube*ek 감사합니다 .. 그대로 따라하겠습니다 근데 여기서 다른점이 하나발생 저 유툽에서는 textual inversion이라는 항목이 따로 있고, 거기에 순서대로 create a new emvedding, preprocess image 이렇게 한 페이지에 모두 포함되어 있다. 그런데 나는 이런식으로 textual inversion 항목 대신 train이라는 항목이 존재하고 나머지가 모두..