evaluation_field

`evaluation_field` ¶

Classes:

Name	Description
`EvaluationField`	Per-column evaluation metadata and distribution scores.

`EvaluationField` `pydantic-model` ¶

Bases: BaseModel

Per-column evaluation metadata and distribution scores.

Fields:

name (str)
training_field_features (FieldFeatures)
synthetic_field_features (FieldFeatures)
training_distribution (dict | None)
synthetic_distribution (dict | None)
distribution_distance (float | None)
distribution_stability (EvaluationScore | None)
column_statistics (ColumnStatistics | None)

`name` `pydantic-field` ¶

Column name from the original dataframe.

`training_field_features` `pydantic-field` ¶

Field type and descriptive statistics for the training column.

`synthetic_field_features` `pydantic-field` ¶

Field type and descriptive statistics for the synthetic column.

`training_distribution` `pydantic-field` ¶

Binned distribution dict for the training column.

`synthetic_distribution` `pydantic-field` ¶

Binned distribution dict for the synthetic column.

`distribution_distance` `pydantic-field` ¶

Jensen-Shannon distance between the two distributions.

`distribution_stability` `pydantic-field` ¶

Graded score derived from the distribution distance.

`column_statistics` `pydantic-field` ¶

PII entity counts and transform metadata, if available.

`from_series(name, training, synthetic, column_statistics=None)` `staticmethod` ¶

Build an EvaluationField from paired training/synthetic column.

Normally called internally by EvaluationDatasets; direct use is rarely needed.

Parameters:

Name	Type	Description	Default
`name`	`str`	Column name.	required
`training`	`Series`	Training column data.	required
`synthetic`	`Series`	Synthetic column data.	required
`column_statistics`	`ColumnStatistics \| None`	PII entity metadata to attach, if available.	`None`

Returns:

Type	Description
`EvaluationField`	A fully populated `EvaluationField` with computed distributions
`EvaluationField`	and stability score.

Source code in src/nemo_safe_synthesizer/evaluation/data_model/evaluation_field.py

@staticmethod
def from_series(
    name: str,
    training: pd.Series,
    synthetic: pd.Series,
    column_statistics: ColumnStatistics | None = None,
) -> EvaluationField:
    """Build an ``EvaluationField`` from paired training/synthetic column.

    Normally called internally by ``EvaluationDatasets``; direct use is
    rarely needed.

    Args:
        name: Column name.
        training: Training column data.
        synthetic: Synthetic column data.
        column_statistics: PII entity metadata to attach, if available.

    Returns:
        A fully populated ``EvaluationField`` with computed distributions
        and stability score.
    """
    training_field_features = describe_field(name, training)
    synthetic_field_features = describe_field(name, synthetic)
    # TODO This was a config setting to explicitly force fields to be categorical.
    # if is_categorical:
    #     training_field_features.type = FieldType.CATEGORICAL
    #     synthetic_field_features.type = FieldType.CATEGORICAL

    # TODO Synthesizer only, but not making conditional until more new config/control is baked up.
    if training_field_features.type == FieldType.NUMERIC and synthetic_field_features.type == FieldType.NUMERIC:
        bins = stats.get_numeric_distribution_bins(training, synthetic)
        training_distribution = stats.get_numeric_field_distribution(training, bins)
        synthetic_distribution = stats.get_numeric_field_distribution(synthetic, bins)
        distribution_distance = stats.compute_distribution_distance(training_distribution, synthetic_distribution)
        distribution_stability = EvaluationField.get_field_distribution_stability(distribution_distance)
    else:
        if is_integer_dtype(training) or is_integer_dtype(synthetic):
            try:
                # If the other column contains float values or has None values with object dtype,
                # first cast it to float, round the values, and then convert to pd.Int64Dtype.
                # This allows missing values to be properly handled and enables meaningful comparisons.
                training = training.astype(float).round().astype(pd.Int64Dtype())
                synthetic = synthetic.astype(float).round().astype(pd.Int64Dtype())
            except ValueError:
                # The other column has something weird that is not a float, just keep going.
                pass
        if (
            training_field_features.count == 0
            or synthetic_field_features.count == 0
            or training_field_features.type in HIGHLY_UNIQUE_TYPES
            or synthetic_field_features.type in HIGHLY_UNIQUE_TYPES
        ):
            training_distribution = None
            synthetic_distribution = None
            distribution_distance = None
            distribution_stability = None
        else:
            training_distribution = stats.get_categorical_field_distribution(training)
            synthetic_distribution = stats.get_categorical_field_distribution(synthetic)
            distribution_distance = stats.compute_distribution_distance(
                training_distribution, synthetic_distribution
            )
            distribution_stability = EvaluationField.get_field_distribution_stability(distribution_distance)

    return EvaluationField(
        name=name,
        training_field_features=training_field_features,
        synthetic_field_features=synthetic_field_features,
        training_distribution=training_distribution,
        synthetic_distribution=synthetic_distribution,
        distribution_distance=distribution_distance,
        distribution_stability=distribution_stability,
        column_statistics=column_statistics,
    )

`get_average_divergence(fields)` `staticmethod` ¶

Compute the mean Jensen-Shannon divergence across a list of fields.

Source code in src/nemo_safe_synthesizer/evaluation/data_model/evaluation_field.py

@staticmethod
def get_average_divergence(fields: list[EvaluationField]) -> float:
    """Compute the mean Jensen-Shannon divergence across a list of fields."""
    if len(fields) > 0:
        average_divergence = reduce(
            lambda x, y: x + y,
            [f.distribution_distance for f in fields if f.distribution_distance is not None],
            0.0,  # ENGPROD-6, default accumulator value may be required
        ) / len(fields)
        return average_divergence
    return 0.0

`text_js_scaling_func(average_divergence)` `staticmethod` ¶

Scale average JS divergence for text data using a linear equation.

Parameters:

Name	Type	Description	Default
`average_divergence`	`float`	Mean JS divergence across text fields.	required

Returns:

Type	Description
`float`	A score in the range `[1.5, 10]`.

Source code in src/nemo_safe_synthesizer/evaluation/data_model/evaluation_field.py

@staticmethod
def text_js_scaling_func(average_divergence: float) -> float:
    """Scale average JS divergence for text data using a linear equation.

    Args:
        average_divergence: Mean JS divergence across text fields.

    Returns:
        A score in the range ``[1.5, 10]``.
    """
    # Scaling with linear equation penalizes the lower range scores drastically, setting the lower values to 15 instead of 0.
    # More explained in this doc.
    if average_divergence > 0.8:
        score = 1.5
    elif average_divergence < 0.12:
        score = 10.0
    else:
        score = -12.5 * average_divergence + 11.5
    return score

`tabular_js_scaling_func(average_divergence)` `staticmethod` ¶

Scale average JS divergence for tabular data using a quadratic equation.

Parameters:

Name	Type	Description	Default
`average_divergence`	`float`	Mean JS divergence across tabular fields.	required

Returns:

Type	Description
`float`	A score in the range `[0, 10]`.

Source code in src/nemo_safe_synthesizer/evaluation/data_model/evaluation_field.py

@staticmethod
def tabular_js_scaling_func(average_divergence: float) -> float:
    """Scale average JS divergence for tabular data using a quadratic equation.

    Args:
        average_divergence: Mean JS divergence across tabular fields.

    Returns:
        A score in the range ``[0, 10]``.
    """
    if average_divergence > 0.99:
        score = 0.0
    elif average_divergence < 0.02:
        score = 10.0
    else:
        score = 7.44 * average_divergence**2 - 16.646 * average_divergence + 10.305
    return score

`get_field_distribution_stability(average_divergence, js_scaling_func=None)` `staticmethod` ¶

Convert an average JS divergence into a graded EvaluationScore.

Parameters:

Name	Type	Description	Default
`average_divergence`	`float`	Mean JS divergence across fields.	required
`js_scaling_func`	`Callable[[float], float] \| None`	Scaling function mapping divergence to a 0--10 score. Defaults to `tabular_js_scaling_func`.	`None`

Returns:

Type	Description
`EvaluationScore`	A finalized `EvaluationScore` with grade and scaled score.

Source code in src/nemo_safe_synthesizer/evaluation/data_model/evaluation_field.py

@staticmethod
def get_field_distribution_stability(
    average_divergence: float,
    js_scaling_func: Callable[[float], float] | None = None,
) -> EvaluationScore:
    """Convert an average JS divergence into a graded ``EvaluationScore``.

    Args:
        average_divergence: Mean JS divergence across fields.
        js_scaling_func: Scaling function mapping divergence to a 0--10
            score. Defaults to ``tabular_js_scaling_func``.

    Returns:
        A finalized ``EvaluationScore`` with grade and scaled score.
    """
    js_scaling_func = js_scaling_func or EvaluationField.tabular_js_scaling_func
    try:
        if np.isnan(average_divergence):
            return EvaluationScore()
        score = js_scaling_func(average_divergence)
        return EvaluationScore.finalize_grade(average_divergence, score)
    except Exception as e:
        logger.exception("Failed to calculate Field Distribution Stability SQS")
        return EvaluationScore(notes=str(e))

evaluation_field