Utilities¶

Utility and helper functions for working with 🤗 Diffusers.

`mindone.diffusers.utils.numpy_to_pil(images)` ¶

Convert a numpy image or a batch of images to a PIL image.

Source code in mindone/diffusers/utils/pil_utils.py

def numpy_to_pil(images):
    """
    Convert a numpy image or a batch of images to a PIL image.
    """
    if images.ndim == 3:
        images = images[None, ...]
    images = (images * 255).round().astype("uint8")
    if images.shape[-1] == 1:
        # special case for grayscale (single channel) images
        pil_images = [Image.fromarray(image.squeeze(), mode="L") for image in images]
    else:
        pil_images = [Image.fromarray(image) for image in images]

    return pil_images

`mindone.diffusers.utils.ms_to_pil(images)` ¶

Convert a torch image to a PIL image.

Source code in mindone/diffusers/utils/pil_utils.py

def ms_to_pil(images):
    """
    Convert a torch image to a PIL image.
    """
    images = (images / 2 + 0.5).clamp(0, 1)
    images = images.permute(0, 2, 3, 1).float().numpy()
    images = numpy_to_pil(images)
    return images

`mindone.diffusers.utils.load_image(image, convert_method=None)` ¶

Loads image to a PIL Image.

PARAMETER	DESCRIPTION
`image`	The image to convert to the PIL Image format. TYPE: `str` or `PIL.Image.Image`
`convert_method`	A conversion method to apply to the image after loading it. When set to `None` the image will be converted "RGB". TYPE: `Callable[[PIL.Image.Image], PIL.Image.Image], optional` DEFAULT: `None`

RETURNS	DESCRIPTION
`Image`	`PIL.Image.Image`: A PIL Image.

Source code in mindone/diffusers/utils/loading_utils.py

def load_image(
    image: Union[str, PIL.Image.Image], convert_method: Optional[Callable[[PIL.Image.Image], PIL.Image.Image]] = None
) -> PIL.Image.Image:
    """
    Loads `image` to a PIL Image.

    Args:
        image (`str` or `PIL.Image.Image`):
            The image to convert to the PIL Image format.
        convert_method (Callable[[PIL.Image.Image], PIL.Image.Image], *optional*):
            A conversion method to apply to the image after loading it. When set to `None` the image will be converted
            "RGB".

    Returns:
        `PIL.Image.Image`:
            A PIL Image.
    """
    if isinstance(image, str):
        if image.startswith("http://") or image.startswith("https://"):
            image = PIL.Image.open(requests.get(image, stream=True).raw)
        elif os.path.isfile(image):
            image = PIL.Image.open(image)
        else:
            raise ValueError(
                f"Incorrect path or URL. URLs must start with `http://` or `https://`, and {image} is not a valid path."
            )
    elif isinstance(image, PIL.Image.Image):
        image = image
    else:
        raise ValueError(
            "Incorrect format used for the image. Should be a URL linking to an image, a local path, or a PIL image."
        )

    image = PIL.ImageOps.exif_transpose(image)

    if convert_method is not None:
        image = convert_method(image)
    else:
        image = image.convert("RGB")

    return image

`mindone.diffusers.utils.export_to_gif(image, output_gif_path=None, fps=10)` ¶

Source code in mindone/diffusers/utils/export_utils.py

def export_to_gif(image: List[PIL.Image.Image], output_gif_path: str = None, fps: int = 10) -> str:
    if output_gif_path is None:
        output_gif_path = tempfile.NamedTemporaryFile(suffix=".gif").name

    image[0].save(
        output_gif_path,
        save_all=True,
        append_images=image[1:],
        optimize=False,
        duration=1000 // fps,
        loop=0,
    )
    return output_gif_path

`mindone.diffusers.utils.export_to_video(video_frames, output_video_path=None, fps=10)` ¶

Source code in mindone/diffusers/utils/export_utils.py

def export_to_video(
    video_frames: Union[List[np.ndarray], List[PIL.Image.Image]], output_video_path: str = None, fps: int = 10
) -> str:
    # TODO: Dhruv. Remove by Diffusers release 0.33.0
    # Added to prevent breaking existing code
    if not is_imageio_available():
        logger.warning(
            (
                "It is recommended to use `export_to_video` with `imageio` and `imageio-ffmpeg` as a backend. \n"
                "These libraries are not present in your environment. Attempting to use legacy OpenCV backend to export video. \n"
                "Support for the OpenCV backend will be deprecated in a future Diffusers version"
            )
        )
        return _legacy_export_to_video(video_frames, output_video_path, fps)

    if is_imageio_available():
        import imageio
    else:
        raise ImportError(BACKENDS_MAPPING["imageio"][1].format("export_to_video"))

    try:
        imageio.plugins.ffmpeg.get_exe()
    except AttributeError:
        raise AttributeError(
            (
                "Found an existing imageio backend in your environment. Attempting to export video with imageio. \n"
                "Unable to find a compatible ffmpeg installation in your environment to use with imageio. Please install via `pip install imageio-ffmpeg"
            )
        )

    if output_video_path is None:
        output_video_path = tempfile.NamedTemporaryFile(suffix=".mp4").name

    if isinstance(video_frames[0], np.ndarray):
        video_frames = [(frame * 255).astype(np.uint8) for frame in video_frames]

    elif isinstance(video_frames[0], PIL.Image.Image):
        video_frames = [np.array(frame) for frame in video_frames]

    with imageio.get_writer(output_video_path, fps=fps) as writer:
        for frame in video_frames:
            writer.append_data(frame)

    return output_video_path

`mindone.diffusers.utils.make_image_grid(images, rows, cols, resize=None)` ¶

Prepares a single grid of images. Useful for visualization purposes.

Source code in mindone/diffusers/utils/pil_utils.py

def make_image_grid(images: List[PIL.Image.Image], rows: int, cols: int, resize: int = None) -> PIL.Image.Image:
    """
    Prepares a single grid of images. Useful for visualization purposes.
    """
    assert len(images) == rows * cols

    if resize is not None:
        images = [img.resize((resize, resize)) for img in images]

    w, h = images[0].size
    grid = Image.new("RGB", size=(cols * w, rows * h))

    for i, img in enumerate(images):
        grid.paste(img, box=(i % cols * w, i // cols * h))
    return grid

`mindone.diffusers.utils.mindspore_utils.randn_tensor(shape, generator=None, dtype=None)` ¶

A helper function to create random tensors with the desired dtype. When passing a list of generators, you can seed each batch size individually.

Source code in mindone/diffusers/utils/mindspore_utils.py

def randn_tensor(
    shape: Union[Tuple, List],
    generator: Optional[Union[List["np.random.Generator"], "np.random.Generator"]] = None,
    dtype: Optional["ms.Type"] = None,
):
    """A helper function to create random tensors with the desired `dtype`. When
    passing a list of generators, you can seed each batch size individually.
    """
    batch_size = shape[0]

    # make sure generator list of length 1 is treated like a non-list
    if isinstance(generator, list) and len(generator) == 1:
        generator = generator[0]

    if isinstance(generator, list):
        shape = (1,) + shape[1:]
        latents = [randn(shape, generator=generator[i], dtype=dtype) for i in range(batch_size)]
        latents = ops.cat(latents, axis=0)
    else:
        latents = randn(shape, generator=generator, dtype=dtype)

    return latents

Utilities¶

mindone.diffusers.utils.numpy_to_pil(images) ¶

mindone.diffusers.utils.ms_to_pil(images) ¶

mindone.diffusers.utils.load_image(image, convert_method=None) ¶

mindone.diffusers.utils.export_to_gif(image, output_gif_path=None, fps=10) ¶

mindone.diffusers.utils.export_to_video(video_frames, output_video_path=None, fps=10) ¶

mindone.diffusers.utils.make_image_grid(images, rows, cols, resize=None) ¶

mindone.diffusers.utils.mindspore_utils.randn_tensor(shape, generator=None, dtype=None) ¶

`mindone.diffusers.utils.numpy_to_pil(images)` ¶

`mindone.diffusers.utils.ms_to_pil(images)` ¶

`mindone.diffusers.utils.load_image(image, convert_method=None)` ¶

`mindone.diffusers.utils.export_to_gif(image, output_gif_path=None, fps=10)` ¶

`mindone.diffusers.utils.export_to_video(video_frames, output_video_path=None, fps=10)` ¶

`mindone.diffusers.utils.make_image_grid(images, rows, cols, resize=None)` ¶

`mindone.diffusers.utils.mindspore_utils.randn_tensor(shape, generator=None, dtype=None)` ¶