Dataset

Main dataset class for organizing evaluation data.

Class Definition

The Python class representing a dataset within Benchwise.

@dataclass
class Dataset:
    name: str
    data: List[Dict[str, Any]]
    metadata: Optional[Dict[str, Any]] = None
    schema: Optional[Dict[str, Any]] = None

Properties

Key attributes and data accessors for the Dataset class.

prompts

@property
def prompts(self) -> List[str]:
    ...

Auto-detects and returns prompts from fields: prompt, input, question, text, or document.

references

@property
def references(self) -> List[str]:
    ...

Auto-detects and returns references from fields: reference, output, answer, target, or summary.

Methods

Functions available for manipulating and querying Dataset objects.

sample

def sample(self, n: int, random_state: Optional[int] = None) -> "Dataset":
    ...

Returns random sample of n items.

filter

def filter(self, condition: callable) -> "Dataset":
    ...

Filters dataset by condition function.

split

def split(self, train_ratio: float = 0.8, random_state: Optional[int] = None) -> Tuple["Dataset", "Dataset"]:
    ...

Splits into train and test sets.

Usage

Examples demonstrating how to work with Dataset objects.

from benchwise import Dataset

dataset = Dataset(
    name="my_dataset",
    data=[
        {"question": "What is AI?", "answer": "Artificial Intelligence"},
        {"question": "What is ML?", "answer": "Machine Learning"}
    ],
    metadata={"version": "1.0"}
)

# Access data
prompts = dataset.prompts  # ["What is AI?", "What is ML?"]
references = dataset.references  # ["Artificial Intelligence", "Machine Learning"]

# Sample
sample = dataset.sample(n=1, random_state=42)

# Filter
filtered = dataset.filter(lambda x: len(x["question"]) > 10)

# Split
train, test = dataset.split(train_ratio=0.8)

Class Definition​

Properties​

prompts​

references​

Methods​

sample​

filter​

split​

Usage​

See Also​