مجموعه داده اثر انگشت NIST SD 302 شامل 10000 تصویر اثر انگشت است، از جمله این تصویر از سمت چسبنده یک تمبر پستی. اکنون مجموعه داده به طور کامل با جزئیاتی مانند مناطق رنگی در سمت راست حاشیه نویسی شده است. رنگها که مناطقی با کیفیت متفاوت را نشان میدهند، به آموزش انسانها و الگوریتمهای یادگیری ماشینی کمک میکنند که چگونه ویژگیهای شناسایی را متمایز کنند و اهمیت آنها را به عنوان مدرک بسنجید.
اعتبار: ب. هیز/NIST
غربال کردن اثر انگشت جمعآوریشده از صحنههای جرم، کار تحلیلگران اثر انگشت و – به طور فزاینده – رایانههای آنهاست. آموزش انسان ها و شرکای ماشینی آنها برای این کار کار دقیق کار آسانی نیست، اما کمک در قالب انتشار داده ها و نرم افزار جدید از موسسه ملی استاندارد و فناوری (NIST) رسیده است.
این دادهها شامل هزاران اثر انگشت همراه با یادداشتهایی که کیفیت آنها را توضیح میدهند، به دنبال انتشار یک بسته نرمافزاری منبع باز است که میتواند به ارزیابی سریع کیفیت چاپ کمک کند. آنها با هم یک جفت ابزار را برای بهبود تخصص دانشمندان پزشکی قانونی ارائه می دهند.
گرگ فیومارا، دانشمند کامپیوتر NIST، گفت: «این دو منبع به بهبود علم شناسایی اثر انگشت کمک خواهند کرد. «دادهها بزرگترین و کاملترین مجموعه داده اثر انگشت در حال حاضر موجود است و این نرمافزار نسخه اصلاحشده ابزار تجزیه و تحلیل چاپی است که توسط مجریان قانون ایالات متحده استفاده میشود و ما بهطور رایگان در دسترس جهانیان قرار میدهیم.»
داده های اثر انگشت، به عنوان بخشی از یادداشت فنی NIST (TN) 2367، نسخه قبلی، پایگاه داده ویژه (SD) 302 را که در ابتدا NIST بود، تقویت می کند در سال 2019 در دسترس قرار گرفت. این شامل حدود 10000 اثر انگشت است که در یک محیط آزمایشگاهی از 200 داوطلب جمع آوری شده است که با استفاده از اثر آنها برای اهداف تحقیقاتی موافقت کردند. تمام اطلاعات شخصی دیگر، از جمله نام داوطلبان و محل سکونت، از پایگاه داده پاک شد.
فیومارا گفت: «نسخهها از افرادی است که ما استخدام کردیم تا بیایند و کارهایی مانند نوشتن یک یادداشت، برداشتن یک صفحه مدار، رسیدگی به یک اسکناس دلاری، و از این قبیل چیزها را انجام دهند. سپس با استفاده از روشهای متفاوتی که بازرسان صحنه جرم معمولاً از آنها استفاده میکنند، آثاری را که آنها به جا گذاشته بودند، بازیابی کردیم.»
از زمان انتشار اولیه این داده ها، بیش از 1000 سازمان تحقیقاتی از بیش از 90 کشور آن را دانلود کرده اند. اما کامل نبود. تنها حدود نیمی از اثر انگشت آن حاوی حاشیهنویسی بود – جزئیات خاصی در مورد یک چاپ که راهنمای ارزیابی کیفیت چاپ را ارائه میدهد. این یادداشتها هستند که پایگاه داده را به ابزار آموزشی ارزشمندی تبدیل میکنند، زیرا به ممتحنان جدید – و به طور فزایندهای هوش مصنوعی – نشان میدهند که هنگام ارزیابی یک چاپ به دنبال چه چیزی باشند و از چه چیزی اجتناب کنند.
اخیراً کارشناسان به عقب برگشتند و حاشیهنویسی برای بقیه چاپها ایجاد کردند. همانند اثر انگشت های جمع آوری شده از صحنه های واقعی جرم، کیفیت اثر در مجموعه داده ها بسیار متفاوت است: در برخی نقاط، خطوط به جا مانده از برجستگی های کوچک و منحنی نوک انگشت واضح و بدون شکستگی هستند، در حالی که در برخی دیگر این خطوط لکه دار یا ناقص هستند. فیومارا گفت، حاشیهنویسیها، که شامل مناطقی هستند که برای نشان دادن سطوح مختلف کیفیت چاپ کدگذاری شدهاند، به آموزش انسانها و هوش مصنوعی به طور یکسان کمک میکنند.
او گفت: “این تصاویر برای آموزش در کلاس درس خوب هستند، تا به ممتحنین آموزش دهند که چگونه به دنبال ویژگی های شناسایی باشند.” و همچنین به آموزش الگوریتمهای هوش مصنوعی کمک میکنند تا به کجا نگاه کنند و چگونه اهمیت یک ویژگی را ارزیابی کنند. با این نوع آموزش، الگوریتم ارزیابی اثر انگشت بهتر خواهد شد.
برای توسعهدهندگان نرمافزار و همچنین بررسیکنندگان چاپ، دومین منبع در نسخه ارزش بیشتری را ارائه میکند. NIST اخیرا نرم افزاری به نام LQMetric را به دست آورد که برای ارزیابی کیفیت اثر انگشت طراحی شده بود، اما استفاده از آن محدود به اجرای قانون ایالات متحده بود. در سال گذشته، NIST بودجه تبدیل نرم افزار را به نسخه ای که بر روی سیستم های مک، ویندوز یا لینوکس اجرا می شود، پرداخت کرد و سپس آن را برای استفاده همه در جهان منبع باز کرد. نرم افزار تازه پیکربندی شده، که NIST آن را OpenLQM می نامد، می تواند به عنوان یک برنامه مستقل عمل کند یا در نرم افزارهای دیگر مانند یک افزونه گنجانده شود.
فیومارا گفت: “شما به OpenLQM یک اثر انگشت می دهید و عددی از 0 تا 100 را برمی گرداند که ارزیابی کیفیت چاپ است.” “این می تواند به ارزیاب های چاپ کمک کند تا سریع تر کار کنند، که در علم پزشکی قانونی مهم است، زمانی که شما اغلب صدها چاپ برای بررسی از صحنه جرم دارید. می خواهید به آنها کمک کنید تا چاپ هایی را که حاوی بالاترین سطح جزئیات هستند جدا کنند. اینجاست که نرم افزار وارد می شود.”
هم مجموعه داده و هم نرم افزار برای کاربران ارزشمند بوده است.
آنتونی کورتنر، یک بازرس تایید شده چاپ پنهان در آزمایشگاه تحقیقات جنایی ارتش ایالات متحده در بخش تحقیقات جنایی ارتش، گفت: “نرم افزار LQMetric یک دارایی ارزشمند بوده است.” “این در تلاشهای ما برای دستیابی به عینیت و تکرارپذیری بیشتر در ارزیابیهای کیفیت چاپ نهفته بسیار مهم بوده است. انتشار منبع باز، تکمیل شده توسط پایگاه داده ویژه NIST 302، نشاندهنده پیشرفت قابلتوجهی برای جامعه جهانی پزشکی قانونی است. آنها با هم، منابع جدید قدرتمندی را برای پزشکان و محققین فراهم میکنند تا نوآوری را در زمینه ایجاد کنند و همکاری را افزایش دهند.”
گزارش: G. Fiumara، M. Schwarz، J. Heising، J. Peterson، K. Ko، P. Flanagan و K. Marshall. پایگاه داده ویژه NIST 302: فالانکس های دیستال پنهان مشروح شده. NIST TN 2367. مارس 2026. DOI: 10.6028/NIST.TN.2367
Source link
