دیداری سازی داده‌ها با استفاده از t-SNE

نوع فایل : word

تعداد صفحات : 23

تعداد کلمات : 9800

مجله : Journal of Machine Learning Research

انتشار : 2008

:

:

:

:

:

تاریخ انتشار
12 فوریه 2020
دسته بندی
تعداد بازدیدها
1008 بازدید
20,000 تومان

عنوان فارسی مقاله:تجسم (دیداری سازی) و متریک عملکرد در بهینه سازی چند منظوره

 

چکیده

 ما یک روش جدید موسوم به t-SNE را ارائه می‌کنیم که داده‌های با ابعاد بالا را با دادن یک محل به هر نقطه داده در یک نقشه دو یا سه بعدی دیداری سازی و مجسم می‌کند. این روش، نسخه‌ای از توکاری همسایگی تصادفی (هینتون و رویز،۲۰۲۲) می‌باشد که بهینه سازی آن آسان‌تر است و منجر به تصویر سازی های بهتری با کاهش تمایل برای نقاط شلوغ در مرکز نقشه می‌شود(دیداری سازی داده‌ها بااستفاده از t-SNE).  t-SNE در ایجاد یک نقشه که ساختار را در بسیاری از مقیاس‌های مختلف آشکار می‌کند نسبت به روش‌های موجود عملکرد بهتری دارد. این موضوع از اهمیت ویژه‌ای برای داده‌های با ابعاد بالا برخوردار است که در مانیفولد های مختلف و با ابعاد پایین نظیر تصاویر اشیا از چندین دسته مشاهده شده از نقاط دید متعدد قرار گرفته است. برای دیداری سازی ساختار مجموعه داده‌های بزرگ، ما نشان می‌دهیم که چگونه t-SNE قادر به استفاده از پیمایش تصادفی بر روی گراف‌های همسایه برای امکان دادن به اثر گذاری ساختار داده‌ها بر شیوه نمایش زیر مجموعه داده است. ما به تشریح عملکرد t-SNE بر روی طیف وسیعی از مجموعه داده‌ها پرداخته و آن را با بسیاری از فنون دیداری سازی غیر پارامتری از جمله نقشه برداری سامون، ایزومپ و توکاری خطی محلی مقایسه می‌کنیم. دیداری سازی تولید شده توسط t-SNE بسیار بهتر از موارد تولید شده توسط سایر فنون تقریباً در همه مجموعه داده‌ها است(دیداری سازی داده‌ها بااستفاده از t-SNE).

ادامه مطلب

راهنمای خرید:
  • لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.

Title: Visualizing Data using t-SNE

Abstract: 

We present a new technique called “t-SNE” that visualizes high-dimensional data by giving each datapoint a location in a two or three-dimensional map. The technique is a variation of Stochastic Neighbor Embedding (Hinton and Roweis, 2002) that is much easier to optimize, and produces significantly better visualizations by reducing the tendency to crowd points together in the center of the map. t-SNE is better than existing techniques at creating a single map that reveals structure at many different scales. This is particularly important for high-dimensional data that lie on several different, but related, low-dimensional manifolds, such as images of objects from multiple classes seen from multiple viewpoints. For visualizing the structure of very large data sets, we show how t-SNE can use random walks on neighborhood graphs to allow the implicit structure of all of the data to influence the way in which a subset of the data is displayed. We illustrate the performance of t-SNE on a wide variety of data sets and compare it with many other non-parametric visualization techniques, including Sammon mapping, Isomap, and Locally Linear Embedding. The visualizations produced by t-SNE are significantly better than those produced by the other techniques on almost all of the data sets.
دیدگاهتان را بنویسید