طبی تحقیق کے لیے AI پر مبنی میڈیکل امیج ڈی-آئیڈینٹیفیکیشن پائپ لائن کیسے بنائی جائے۔

میڈیکل امیجنگ صحت کی دیکھ بھال کو تبدیل کر رہی ہے۔ محققین سینے کے ایکس رے کے ذریعے نمونیا کا پتہ لگانے، ایکو کارڈیوگرافی کے ذریعے دل کے کام کا اندازہ لگانے، اور MRI اسکینوں کے ذریعے ٹیومر کی شناخت کرنے کے لیے گہرے سیکھنے کے ماڈلز کو تربیت دے رہے ہیں۔ لیکن اس سے پہلے کہ ان تصاویر کو محققین کے ساتھ شیئر کیا جائے یا مشین لرننگ ماڈلز کو تربیت دینے کے لیے استعمال کیا جائے، ایک اہم چیلنج سے نمٹنا ضروری ہے۔

آپ مریض کی ذاتی معلومات کی حفاظت کیسے کرتے ہیں؟

طبی تصاویر میں اکثر حساس معلومات ہوتی ہیں جیسے مریض کا نام، تاریخ پیدائش، ہسپتال کا شناخت کنندہ، اور الحاق نمبر۔ اس میں سے کچھ معلومات DICOM (طب میں ڈیجیٹل امیجنگ اور مواصلات) یہ میٹا ڈیٹا ہے، لیکن اس کا زیادہ تر حصہ براہ راست تصویری پکسلز میں بیک کیا جاتا ہے۔

اس ٹیوٹوریل میں، AI پر مبنی گمنام پائپ لائن بنانے کا طریقہ سیکھیں جو پی ایچ آئی کو میٹا ڈیٹا اور امیج پکسلز دونوں سے ہٹاتی ہے۔ راستے میں، ہم آپٹیکل کریکٹر ریکگنیشن (OCR)، نام شدہ ہستی کی شناخت (NER)، اور معیارات پر مبنی DICOM پروسیسنگ کو دیکھیں گے۔

آخر میں، میں آپ کو دکھاؤں گا کہ ان خیالات کو ایک اوپن سورس PyTorch پروجیکٹ میں کیسے یکجا کیا جائے جسے Aegis کہتے ہیں۔

کیا تعمیر کرنا ہے

اس ٹیوٹوریل میں، آپ اپنی مرضی کے مطابق MONAI (PyTorch) پری پروسیسنگ پائپ لائن بناتے ہیں جو طبی امیجز کو طبی تحقیق یا AI ماڈل ٹریننگ کے لیے استعمال کرنے سے پہلے خود بخود گمنام کر دیتی ہے۔

پائپ لائن مندرجہ ذیل کام کرتی ہے:

DICOM تحقیق کو دریافت کریں۔
میٹا ڈیٹا اور پکسل ڈیٹا لوڈ کریں۔
OCR کا استعمال کرتے ہوئے جلے ہوئے متن کا پتہ لگائیں۔
متن کو PHI یا غیر PHI کے طور پر درجہ بندی کریں۔
حساس پکسل ایریاز میں ترمیم کریں۔
DICOM میٹا ڈیٹا اور پکسل ڈیٹا سے PHI کو ہٹا دیں۔
ڈاؤن اسٹریم AI ورک فلو کے لیے رازداری کو محفوظ رکھنے والی تصاویر کو اسٹور کریں۔

بالآخر، آپ کے پاس دوبارہ قابل استعمال MONAI تبدیلی ہوگی جسے تحقیق اور گہری سیکھنے کے لیے رازداری کے تحفظ کے ڈیٹاسیٹس کو تیار کرنے کے لیے کسی بھی طبی امیجنگ ورک فلو میں براہ راست ضم کیا جا سکتا ہے۔

شرطیں

اس ٹیوٹوریل پر عمل کرنے کے لیے آپ کو ضرورت ہو گی:

انٹرمیڈیٹ ازگر کا تجربہ
PyTorch کی بنیادی تفہیم
میڈیکل امیجنگ کے تصورات کو سمجھنا
Python 3.10 یا اس سے زیادہ

ہم استعمال کریں گے:

راہب
پائیک کے ساتھ
ایزی او سی آر
NumPy
ٹرانسفارمر
سٹینفورڈ NER

ترجیحات

# Create and activate a virtual environment
python -m venv venv
source venv/bin/activate        # On Windows: venvScriptsactivate

# Upgrade pip
pip install --upgrade pip

# Install the core libraries used in this tutorial
pip install 
    monai 
    pydicom 
    easyocr 
    numpy 
    transformers 
    torch 

# Download the Stanford medical de-identification model from Hugging Face
python -c "
from transformers import AutoTokenizer, AutoModelForTokenClassification

model_name="StanfordAIMI/stanford-deidentifier-base"
AutoTokenizer.from_pretrained(model_name)
AutoModelForTokenClassification.from_pretrained(model_name)
print('Stanford NER model downloaded successfully.')
"

طبی امیجنگ میں رازداری کیوں اہم ہے۔

صحت کی دیکھ بھال کرنے والی تنظیمیں ہر روز بہت زیادہ امیجنگ ڈیٹا تیار کرتی ہیں۔ یہ ڈیٹا سیٹ اس کے لیے بہت اہم ہیں:

تاہم، ریاستہائے متحدہ میں ہیلتھ انشورنس پورٹیبلٹی اینڈ اکاونٹیبلٹی ایکٹ (HIPAA) جیسے رازداری کے ضوابط کا تقاضا ہے کہ ڈیٹا شیئر کرنے سے پہلے محفوظ شدہ صحت کی معلومات (PHI) کو ہٹا دیا جائے۔ یہ ایک سنگین رکاوٹ پیدا کرتا ہے۔

بہت سے ہسپتال اب بھی ہزاروں تصاویر کو اسکین کرنے اور میٹا ڈیٹا اور تصویری تشریحات میں چھپے ہوئے مریض کے شناخت کنندگان کو تلاش کرنے کے لیے دستی جائزے پر انحصار کرتے ہیں۔ یہ عمل سست، مہنگا اور انسانی غلطی کا شکار ہے۔

اس مسئلے کو حل کرنے کے لیے خودکار ڈی-آئیڈینٹیفیکیشن سافٹ ویئر انجینئرنگ، کمپیوٹر ویژن، اور قدرتی زبان کی پروسیسنگ کو یکجا کرتی ہے۔

PHI، HIPAA، اور DICOM کو سمجھنا

PHI کیا ہے؟

پروٹیکٹڈ ہیلتھ انفارمیشن (PHI) میں ایسی کوئی بھی معلومات شامل ہوتی ہے جو مریض کی شناخت کرتی ہو، جیسے:

Name
Medical record number
Date of birth
Study date
Hospital ID
Accession number

HIPAA کیا ہے؟

ہیلتھ انشورنس پورٹیبلٹی اینڈ اکاونٹیبلٹی ایکٹ (HIPAA) مریضوں کے ڈیٹا کی حفاظت کے لیے قواعد کی وضاحت کرتا ہے۔ ایک عام طریقہ سیف ہاربر طریقہ ہے، جس کے لیے ضروری ہے کہ ڈیٹا شیئر کرنے سے پہلے مخصوص شناخت کنندگان کو ہٹا دیا جائے۔

DICOM کیا ہے؟

طبی تصاویر، وغیرہ کمپیوٹیڈ ٹوموگرافی (CT), مقناطیسی گونج امیجنگ (MRI)اور الٹراساؤنڈ (امریکہ) عام طور پر DICOM میں محفوظ کیا جاتا ہے۔ (طب میں ڈیجیٹل امیجنگ اور مواصلات) میڈیکل امیجنگ ڈیٹا کو ذخیرہ کرنے اور تبادلے کے لیے ایک بین الاقوامی معیاری فارمیٹ۔

JPEG یا PNG جیسے عام تصویری فارمیٹس کے برعکس، DICOM فائلوں میں خود تصویر اور مریض، مطالعہ اور امیجنگ کے طریقہ کار کو بیان کرنے والے ساختی میٹا ڈیٹا کا ایک بھرپور مجموعہ ہوتا ہے۔

ایک عام DICOM فائل میں دو اہم اجزاء ہوتے ہیں:

پکسل ڈیٹا – اصلی طبی تصاویر بشمول CT سلائسس، MRI والیوم، الٹراساؤنڈ فریم وغیرہ۔
میٹا ڈیٹا – سٹرکچرڈ فیلڈز جن میں شامل ہو سکتے ہیں:
- مریض کا نام اور میڈیکل ریکارڈ نمبر
- سالگرہ
- مطالعہ اور حصول کی تاریخ
- امیجنگ تکنیک (CT، MRI، USA)
- سکینر کارخانہ دار اور ٹیکنالوجی کے حصول کے پیرامیٹرز

یہ مجموعہ DICOM کو صرف ایک تصویری شکل سے زیادہ بناتا ہے۔ یہ ایک معیاری کنٹینر کے طور پر کام کرتا ہے جو امیجنگ آلات، ہسپتال کے نظام، اور تحقیقی سافٹ ویئر کو قابل اعتماد اور مستقل طور پر ڈیٹا کا تبادلہ کرنے کی اجازت دیتا ہے۔

چونکہ DICOM میٹا ڈیٹا میں اکثر محفوظ شدہ صحت کی معلومات (PHI) شامل ہوتی ہے اور، خاص طور پر الٹراساؤنڈ اسٹڈیز میں، شناخت کنندگان کو براہ راست تصویری پکسلز میں بیک کیا جا سکتا ہے، اس سے پہلے کہ طبی تحقیق یا AI ڈیولپمنٹ کے لیے تصاویر کو محفوظ طریقے سے شیئر کیا جا سکے، میٹا ڈیٹا اور پکسل ڈیٹا دونوں کو ڈی آئیڈینٹیفیکیشن کے عمل میں پروسیس کیا جانا چاہیے۔

بہت سے ٹولز صرف پی ایچ آئی کو میٹا ڈیٹا سے ہٹاتے ہیں۔ مثال کے طور پر، PatientName ٹیگ کو حذف کرنا کافی لگتا ہے۔

تاہم، الٹراساؤنڈ، فلوروسکوپی، اور کچھ ایکس رے ورک فلو جیسے طریقوں میں، شناختی معلومات اکثر براہ راست تصویر میں لکھی جاتی ہیں۔

عام مثالوں میں شامل ہیں:

NAME: JOHN DOE
DOB: 01/01/1980
MRN: 123456
HOSPITAL: ABC

اگر یہ تبصرے باقی رہتے ہیں تو پھر بھی آپ کی رازداری سے سمجھوتہ کیا جائے گا۔ اس کا مطلب یہ ہے کہ مکمل حل دونوں کو چیک کرنا ضروری ہے:

DICOM میٹا ڈیٹا
تصویر پکسل

PHI شناخت کے لیے OCR اور AI

پکسل میں موجود PHI کا پتہ لگانے کے لیے، آپ کو پہلے تمام مرئی متن کو تلاش کرنا چاہیے۔

مرحلہ 1: آپٹیکل کریکٹر ریکگنیشن (OCR)

OCR تصویری متن کو مشین کے پڑھنے کے قابل تاروں میں تبدیل کرتا ہے۔

import easyocr
reader = easyocr.Reader(['en'])
results = reader.readtext('ultrasound.png')

ہر OCR نتیجہ میں عام طور پر شامل ہیں:

باؤنڈنگ باکس کوآرڈینیٹ – جہاں تصویر میں متن ظاہر ہوتا ہے۔
نکالا ہوا متن – پہچانے گئے حروف
اعتماد کا اسکور – ماڈل اپنے نتائج کے بارے میں کتنا یقینی ہے۔

ہاں:

[
  ([[10, 20], [120, 20], [120, 45], [10, 45]], 'JOHN DOE', 0.98)
]

مرحلہ 2: چیک کریں کہ آیا متن PHI ہے۔

تمام دریافت شدہ متن کو ہٹایا نہیں جانا چاہئے.

طبی امیجز میں طبی لحاظ سے متعلقہ لیبل بھی شامل ہوتے ہیں، جیسے:

LEFT VENTRICLE
APICAL VIEW
B-MODE

PHI کو جائز طبی متن سے ممتاز کرنے کے لیے، آپ یکجا کر سکتے ہیں:

معلوم طبی اصطلاحات کی سفید فہرست
ریگولر ایکسپریشن ہیورسٹک
نامزد ہستی کی شناخت (NER)

مرحلہ 3: نامزد اداروں کو پہچانیں۔

NER ماڈل درج ذیل اداروں کی شناخت کرتا ہے:

PERSON
DATE
LOCATION
ID

def contains_phi(text): 
    if looks_like_date(text): 
    return True 
    if looks_like_identifier(text): 
    return True 
    return ner_model.predict(text)

یہ ہائبرڈ نقطہ نظر غلط مثبت اور غلط منفی دونوں کو کم کرتا ہے۔

پکسل ایڈیٹنگ

ایک بار جب PHI کا پتہ چل جاتا ہے، تو تصویر کے اس حصے کو ماسک کیا جا سکتا ہے۔

image[y1:y2, x1:x2] = 0

یہ حساس علاقوں کو بلیک پکسلز سے بدل دے گا۔

DICOM میٹا ڈیٹا اسکربنگ

pydicom آپ کو میٹا ڈیٹا فیلڈز میں ترمیم یا ہٹانے کی اجازت دیتا ہے۔

import pydicom

ds = pydicom.dcmread('study.dcm')
ds.PatientName="ANONYMIZED"
del ds.PatientBirthDate

اضافی اقدامات میں شامل ہوسکتا ہے:

میٹا ڈیٹا اسکربنگ اور پکسل ترمیم کا امتزاج جامع ڈی-شناخت فراہم کرتا ہے۔

مکمل پائپ لائن کی تعمیر

مکمل ورک فلو مندرجہ ذیل ہے:

طبی تصویری فائلوں کو تلاش کریں۔
DICOM میٹا ڈیٹا اور پکسل ڈیٹا لوڈ کریں۔
تشریح کے علاقے میں OCR چلائیں۔
متن کو PHI یا غیر PHI کے طور پر درجہ بندی کریں۔
حساس پکسل ایریاز میں ترمیم کریں۔
میٹا ڈیٹا سے پی ایچ آئی کو ہٹا دیں۔
گمنام آؤٹ پٹ اسٹور کریں۔

چیلنجز اور اسباق

استعمال کے لیے تیار ڈی-شناختی نظام کی تعمیر کے لیے بہت سے عملی چیلنجز درکار ہوتے ہیں۔

طبی اصطلاحات

OCR جائز لیبلز کا پتہ لگا سکتا ہے جنہیں ہٹایا نہیں جانا چاہیے۔

OCR خرابی۔

کم کنٹراسٹ ٹیکسٹ اور الٹراساؤنڈ اوورلیز غلط کھوج پیدا کر سکتے ہیں۔

نیسٹڈ DICOM ترتیب

پی ایچ آئی گہرے نیسٹڈ میٹا ڈیٹا ڈھانچے میں ظاہر ہو سکتا ہے۔

ملٹی فریم اسٹڈی

الٹراساؤنڈ سین لوپ میں دسیوں یا سینکڑوں فریم ہو سکتے ہیں۔

قطعی تخلص

محققین کو اکثر مطالعہ کے دوران ایک ہی متبادل شناخت کنندہ حاصل کرنے کے لیے ایک ہی مریضوں کی ضرورت ہوتی ہے۔

ان چیلنجوں کے لیے ایک مشین لرننگ ماڈل کے بجائے سوچ سمجھ کر انجینئرنگ کی ضرورت ہوتی ہے۔

میں نے ایجس کیسے بنایا

اس مسئلے کو دریافت کرتے ہوئے، میں نے مندرجہ ذیل اوپن سورس MONAI (PyTorch-based) پروجیکٹ تیار کیا۔ حفاظت.

ایجس یکجا کرتا ہے:

OCR پر مبنی متن کا پتہ لگانا
AI پر مبنی PHI کی درجہ بندی
پکسل کی سطح کی تبدیلیاں
معیارات پر مبنی DICOM ڈی-شناخت
تحقیقی کام کے بہاؤ کے لیے بیچ پروسیسنگ

کلیدی ڈیزائن کے فیصلے

پہلے معیارات

صحت کی دیکھ بھال کے قائم کردہ معیارات پر عمل کرنے کے لیے، میٹا ڈیٹا اسکربنگ کو DICOM رازداری کے پروفائلز کے ساتھ جوڑا گیا تھا۔

ہائبرڈ AI + قواعد

کلینیکل وائٹ لسٹنگ، ہیورسٹکس، اور NER ماڈلز درستگی کو بہتر بنانے کے لیے مل کر کام کرتے ہیں۔

الٹراساؤنڈ کے لیے مخصوص اصلاح

ایجس کے استعمال SequenceOfUltrasoundRegions پوری تصویر کو اسکین کرنے کے بجائے، OCR تشریح شدہ جگہ پر فوکس کرتا ہے۔

ڈیٹرمنسٹک شناخت کا انتظام

مسلسل تخلص رازداری کی حفاظت کرتے ہوئے طولانی تحقیق کو قابل بناتے ہیں۔

اوپن سورس فن تعمیر

یہ پروجیکٹ ماڈیولر، قابل جانچ، اور تحقیقی پائپ لائنز کے ساتھ ضم کرنے کے لیے ڈیزائن کیا گیا ہے۔

آپ ایجس گٹ ہب ریپوزٹری میں مکمل نفاذ کو تلاش کرسکتے ہیں۔

https://github.com/lakshmi-mahabaleshwara/aegis

مستقبل کی سمت

خودکار ڈی-شناخت کا عمل جاری ہے۔

مستقبل کی بہتری میں شامل ہیں:

جیسے جیسے ہیلتھ کیئر AI پھیلتا ہے، ڈیٹا کی تیاری جو رازداری کی حفاظت کرتی ہے زیادہ اہم ہو جائے گی۔

نتیجہ

طبی تحقیق کا انحصار اعلیٰ معیار کے طبی امیجنگ ڈیٹا تک رسائی پر ہے۔

تاہم، رازداری کے ضوابط کے مطابق مریض کے شناخت کنندگان کو DICOM میٹا ڈیٹا اور تصویری پکسلز دونوں سے ہٹا دیا جانا چاہیے۔

OCR، نام شدہ ہستی کی شناخت، پکسل ایڈیٹنگ، اور معیارات پر مبنی DICOM پروسیسنگ کو یکجا کر کے، آپ اس کام کو خودکار کر سکتے ہیں اور دستی جائزے کے بوجھ کو نمایاں طور پر کم کر سکتے ہیں۔

اس ٹیوٹوریل میں شامل تکنیک ایک سے زیادہ پروجیکٹ پر لاگو ہوتی ہیں۔

چاہے آپ ہسپتال کی ڈیٹا پائپ لائن بنا رہے ہوں، تحقیقی ڈیٹا سیٹس تیار کر رہے ہوں، یا صحت کی دیکھ بھال کے AI ماڈلز کی اگلی نسل کو تربیت دے رہے ہوں، خودکار ڈی-شناخت ایک بنیادی خصوصیت ہے۔

ان خیالات کو عملی جامہ پہنانے کے لیے، میں نے Aegis کو اوپن سورس ریفرنس کے نفاذ کے طور پر بنایا۔

مزید اہم بات یہ ہے کہ بنیادی تصورات ڈویلپرز اور محققین کو رازداری کو محفوظ رکھنے والے ورک فلو بنانے میں مدد کر سکتے ہیں جو مریض کی رازداری کا احترام کرتے ہوئے جدت کو تیز کرتے ہیں۔