whisperbox-transcribe/app/shared/db/schemas.py

import enum
from datetime import datetime
from uuid import UUID

from pydantic import AnyHttpUrl, BaseModel, Field


class WithDbFields(BaseModel):
    id: UUID
    created_at: datetime
    updated_at: datetime | None

    class Config:
        orm_mode = True


class ArtifactType(str, enum.Enum):
    raw_transcript = "raw_transcript"


class JobType(str, enum.Enum):
    transcript = "transcript"
    translation = "translation"
    language_detection = "language_detection"


class JobStatus(str, enum.Enum):
    """Processing status of a job."""

    create = "create"
    processing = "processing"
    error = "error"
    success = "success"


class JobConfig(BaseModel):
    """Configuration for a job."""

    # TODO: limit to locales selected by whisper.
    language: str | None = Field(
        description=(
            "Spoken language in the media file. "
            "While optional, this can improve output."
        )
    )


class JobMeta(BaseModel):
    """Metadata relating to a job's execution."""

    error: str | None = Field(
        description="Will contain a descriptive error message if processing failed."
    )
    task_id: UUID | None = Field(
        description="Internal celery id of this job submission."
    )


class Job(WithDbFields):
    """A transcription job for one media file."""

    status: JobStatus
    type: JobType
    url: AnyHttpUrl
    meta: JobMeta | None
    config: JobConfig | None


class RawTranscript(BaseModel):
    """A single transcript passage returned by whisper."""

    id: int
    seek: int
    start: float
    end: float
    text: str
    tokens: list[int]
    temperature: float
    avg_logprob: float
    compression_ratio: float
    no_speech_prob: float


class Artifact(WithDbFields):
    """whisper output for one job."""

    data: list[RawTranscript] | None
    job_id: UUID
    type: ArtifactType