🧮 DataFrame Wrapper User Guide

The LineageDataFrame (DataFrame Wrapper) is the heart of DataLineagePy. It transparently wraps your pandas DataFrames, automatically tracking every operation for full lineage and auditability—while remaining 100% pandas-compatible.

✨ Why Use LineageDataFrame?

Zero code changes: Use your DataFrames as usual
Automatic lineage: Every transformation, filter, join, and aggregation is tracked
Rich metadata: Attach source, owner, schema, and more
Seamless integration: Works with all pandas methods and DataLineagePy features

🚀 Getting Started

from datalineagepy import LineageTracker, LineageDataFrame
import pandas as pd

tracker = LineageTracker(name="my_pipeline")
df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
ldf = LineageDataFrame(df, name="users", tracker=tracker)

🛠️ Core Operations

Column Selection

# Single column
name_col = ldf['name']
# Multiple columns
subset = ldf[['name', 'age']]

Row Filtering

adults = ldf[ldf['age'] >= 18]

Assignment & Transformation

ldf2 = ldf.assign(is_adult=ldf._df['age'] >= 18)

GroupBy & Aggregation

grouped = ldf.groupby('age').agg({'name': 'count'})

Chaining Operations

result = ldf[ldf['age'] > 20].assign(category='senior')

🏷️ Metadata & Advanced Usage

ldf = LineageDataFrame(df, name="customers", tracker=tracker, metadata={
    'source': 'database',
    'table': 'customers',
    'schema': 'public',
    'last_updated': '2025-09-17',
    'owner': 'data_team'
})

🔍 Under the Hood

All operations (selection, assignment, filtering, joins, merges, groupby, etc.) are tracked as nodes and edges in the lineage graph.
Access the underlying DataFrame with . _df if you need raw pandas methods.

Export lineage at any time:

print(tracker.export_graph())
tracker.visualize()

🧑‍💻 Best Practices

Always use LineageDataFrame for any data you want to track
Use meaningful name and metadata for each DataFrame
Chain operations for clear, auditable pipelines
Use .visualize() and .export_graph() to review your lineage

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

🧮 DataFrame Wrapper User Guide

✨ Why Use LineageDataFrame?

🚀 Getting Started

🛠️ Core Operations

Column Selection

Row Filtering

Assignment & Transformation

GroupBy & Aggregation

Chaining Operations

🏷️ Metadata & Advanced Usage

🔍 Under the Hood

🧑‍💻 Best Practices

🏁 Next Steps

FilesExpand file tree

dataframe-wrapper.md

Latest commit

History

dataframe-wrapper.md

File metadata and controls

🧮 DataFrame Wrapper User Guide

✨ Why Use LineageDataFrame?

🚀 Getting Started

🛠️ Core Operations

Column Selection

Row Filtering

Assignment & Transformation

GroupBy & Aggregation

Chaining Operations

🏷️ Metadata & Advanced Usage

🔍 Under the Hood

🧑‍💻 Best Practices

🏁 Next Steps