تبدیل HTML به voiceXML

1.اعظم محمد زاده 2. مهدی خلیلی

1-کارشناس ارشد مهندسی نرم افزار-تهران –ایران - edu@toolmaker.i r
2-مهدی خلیلی-استادیار دانشگاه پیام نور-تهران-ایران - m.khalili@pnu.ac.ir
کلیدواژه: تبدیل HTML به voiceXML،، تحت شبکه، سیستم‌های صوتی، فهرست بهینه ساختار درختی، ناتوانی بینایی.

1. مقدمه:
در واقع در دهه 1980 استفاده از قالب‌های گرافکی، صوت و تصویر در فایل‌های متنی به سادگی امکان‌پذیر نبود و به همین دلیل کاربران نمی‌توانستند از ابزارها و اطلاعات ارائه شده در سایت‌ها به راحتی استفاده کنند. اما ظهور استاندارد اینترنتی HTML این روند را تغییر داد HTML(Hyper Text Markup Language) به معنای زبان نشانه‌گذاری فرامتن است. البته باید توجه داشت که HTML یک زبان برنامه نویسی نیست، زبانی است برای نشانه گذاری که برای تدوین قالب و طراحی صفحه‌های وب به کار می‌رود. این زبان به شما امکان می‌دهد متن را قالب دهی کنید، تصاویر گرافیکی، صوت و ویدیو را اضافه کنید و همه اینها را در یک فایل متنی که هر کامپیوتری می‌تواند آن را بخواند ذخیره کنید و سپس در صورت تمایل آنرا از طریق شبکه جهانی اینترنت با همه نیا به اشتراک بگذارید. اهداف اصلی اچ‌تی‌ام‌ال ۵ بهبود این زبان به صورتی است که از جدیدترین فناوری‌های چند رسانه‌ای پشتیبانی کند در حالی که هم به راحتی توسط انسان‌ها قابل خواندن باشد وهم به طور مداوم توسط رایانه‌ها و دستگاه‌ها (مرورگرهای وب، تجزیه کننده‌ها و غیره) قابل درک باشد. اچ‌تی‌ام‌ال ۵ در نظر دارد نه تنها HTML4 بلکه XHTML۱ و ۲HTML را نیز پشتیبانی کند [1 and 2].

اچ‌تی‌ام‌ال ۵ شامل جزئیات مدل‌های پردازش است تا پیاده سازی سازگارتری داشته باشد. اچ‌تی‌ام‌ال ۵ نشانه گذاری برای اسناد در دسترس را گسترش می‌دهد، بهبود می‌بخشد و توجیه می‌کند. هم چنین نشانه گذاری و رابط برنامه نویسی کاربردی (API ها) را برای برنامه‌های پیچیده تحت وب معرفی می‌کند. به همین دلیل، HTML5 کاندیدای بالقوه برای برنامه‌های کاربردی تلفن همراه کراس پلت فرم است [3]. بسیاری از ویژگی‌های HTML۵ با در نظر گرفتن توانایی اجرا بر روی دستگاه‌های کم قدرت مانند گوشی‌های هوشمند و تبلت‌ها ساخته شده‌است. به طور خاص اچ‌تی‌ام‌ال ۵ ویژگی‌های نحوی بسیاری را به این زبان اضافه کرده‌است. این ویژگی‌ها عبارتند از عناصری مثل <audio>، <header>، <video> و <canvas>. هم چنین یکپارچه سازی محتوایی گرافیک برداری مقیاس پذیر (SVG) که جایگزین تگ <object> است. این ویژگی‌ها برای این طراحی شدند تا وارد کردن و کار با محتوای چند رسانه‌ای و گرافیکی آسان‌تر شود و به پلاگین‌های اختصاصی و API ها نیازی نباشد. عناصرجدید دیگر مانند <nav> و <article>، <header>، <section> برای توانمندتر کردن محتوای نحوی اسناد طراحی شده‌اند. صفت‌های جدید دیگری نیز به همین منظور معرفی شده‌اند، در حالی که برخی از عناصر و ویژگی‌ها نیز حذف شده‌اند [4]. با این وجود، برای بسیاری از دانش آموزان، خصوصاً افرادی با ناتوانی بینایی و حرکتی، دسترسی به شبکه‌های تحصیلی و واحدهای درسی ارائه شده برای ادامه تحصیل تبدیل به یک مشکل عظیم شده است. با توجه به افزایش سریع میزان اطلاعات در دسترس از طریق شبکه اهمیت دسترسی به شبکه‌ها در حال افزایش است [2 and 5].

در این مقاله اصول و روش‌هایی ارائه خواهد شد که با استفاده از آن می‌توان محتوای مطالعاتی دروس ارائه شده تحت وب را که به صورت زبان HTML کدبندی کرده و آن را به صورت سیستم استاندارد تلفنی و محاوره‌ای voiceXML تغییر داد. بنابراین این مسئله، رابط کاربر گرافیکی را قادر می‌سازد تا بتواند اطلاعات مورد نظر را به شکل محاوره‌ای تغییر شکل داده و به راحتی برای افراد با ناتوانی بینایی و حرکتی مناسب بوده و مورد استفاده قرار گیرد. همچنین در این مطالعه به برخی از مشکلات موجود در رابطه با تبدیل فهرست‌های ابرمتنی HTML به شکل مناسب‌تر آن یعنی voiceXML که هدایت محاوره‌ای را بهینه‌تر می‌سازد پرداخته خواهد شد. علاوه بر این در این مطالعه، تشریحی از فهرست درختی بهینه برای سیستم‌های محاوره‌ای و برخی از نتایج مطالعات مرتبط ارائه گردیده است [3].

2. نکات ابتدایی
در این مطالعه از تئوری گراف برای برخی از اصول پایه‌ای استفاده شده است. یک گراف مستقیم گرافی است که دارای حاشیه‌های راست باشد. یک ساختار درختی مستقیم یک گراف راست می‌باشد که گراف پوشش دهنده آن یک درخت می‌باشد. یک درخت ریشه دار یک درخت مستقیم می‌باشد که دارای یک رأس متمایز به نام r می‌باشد که این همان ریشه نام نهاده می‌شود. در این صورت ریشه برای هر رأس دیگر همچون v مسیری مستقیم به رئوس r و v را خواهد داشت. بطوریکه اگر از رأس v ریشه‌های دوانده شود و از این ریشه‌ها رئوس دیگر همچون w بدست آید در این صورت به اصطلاح w فرزند v خوانده می‌شود. یک درخت منظم یک درخت ریشه دار است که برای فرزندان هر رأس آن یک نظم ثابت مشخص شده است. در پایان اگر T یک گراف مستقیم باشد آنگاه تابع V (T) برگرداننده تمام رئوس T می‌باشد [6 and 7].

3. انتقال HTML به voiceXML
مهم‌ترین رویکرد یا روش برای تبدیل رابط کاربر گرافیکی به یک رابط محاوره‌ای که بر پایه تبدیل زبان توصیفی رابط کاربر گرافیکی از جمله (HTML, XUL,….) به یک زبان توصیفی محاوره‌ای از جمله voiceXML است [1, 2,5,6] تفاوت‌های ارتباطی بین بینایی و شنوایی باعث مشکلات فراوانی در این تحقیق شده است. به عنوان مثال: چگونگی دریافت انتقال بهینه توسط عناصر ورودی از طریق رابط کاربر گرافیکی یا چگونگی دست یابی به یک توصیف برای هر عنصر ورودی می‌باشند.
در این رابطه می‌توان به دو روش مناسب برای تبدیل رابط کاربر گرافیکی اشاره کرد. اولاً، ما قادر هستیم تا تبدیلات را کم و بیش بصورت مستقیم به voiceXML داشته باشیم. که این مورد توسط انجام موارد زیر میسر می‌شود [8, 9].
1. در تبدیل مستقیم، عناصر با توجه به ترتیبی که در رابط کاربر گرافیکی نمایش داده می‌شود از بالا سمت چپ و از پایین سمت راست تبدیل می‌شوند. در این رابطه مثالی در شکل 1 نمایش داده شده است. همچنین بخشی از رابط محاوره‌ای به عنوان نتیجه نیز در شکل شماره 2 نمایش داده شده است.
2. در تبدیل بهینه، ترتیب عناصر مورد نظر برای بهینه سازی طول رابط محاوره‌ای مورد نظر تغییر داده می‌شود. نتایج محاوره ممکن است به دلیل تعداد کم نتایج سئوالات متوقف شود. در این راستا بخشی از رابط محاوره مرتبط در شکل شماره 3 نمایش داده شده است. محاوره‌های autumn.vxml و spring.vxml برای یک‌ترم تحصیلی طوری سازگار گشته تا به کاربر اجازه وارد کردن موارد نامعتبر را ندهد.
شکل شماره 1: مثالی از رابط کابر گرافیکی مورد استفاده در تبدیل.

lecture.vxml
...
<form id=”lectureaccess”>
<field name=”lec”>
<prompt>Enter the lecture title</prompt>
<grammar type=”application/srgs+xml” src=”lectures”/>
</field>
<field name=”teach”>
<prompt>Enter teacher</prompt>
<grammar type=”application/srgs+xml” src=”teachers”/>
</field>
<field name=”sem”>
<prompt>Select semestr. Possible values are autumn or
spring.</prompt>
<grammar type=”application/srgs+xml”
src=”semester”/>
</field>
<block>
<prompt> Wait please. Your request is being processed.
</prompt>
<submit next=”some uri” namelist=”lec tech sem ”/>
</block>
</form>

شکل شماره 2: رابط محاوره‌ای در تبدبل مستقیم.

در مرحله بعد، ما قادر هستیم تا یک شناسایی تبدیلی را در یک محاوره ترکیبی آغازین مورد بررسی قرار دهیم. در این حالت، سیستم تلاش می‌کند تا حد امکان تمام مقادیر گزینه‌ها را از درخواست اولیه کاربرتشخیص دهد. لذا فرمان درخواست شده کاربر زمانی اجرا می‌شود که کاربر مقادیر مشخص شده را وارد کند. در غیر این صورت سیستم از کاربر درخواست می‌کند تا گزینه‌ها را کامل کند [10].

lecture.vxml
...
<menu>
<prompt>Select the semestr</prompt>
<choice next=”http://localhost/autumn.vxml”>autumn
</choice>
<choice next=”http://localhost/spring.vxml”>spring
</choice>
</menu>

شکل شماره 3. شماتیکی از رابط محاوره‌ای مربوط به تبدیل بهینه
حالت‌های دیگر از این موضوع زمانی اتفاق می افتد که یک رابط محاوره‌ای برای یک متن ساختارمند مورد نیاز باشد. مشکل تبدیل متن ساختاری به شکل محاوره‌ای در بخش بعدی مورد بحث قرار گرفته است [11].

<form id=”requests”>
<field name=”request”>
<prompt>Welcome to lecture material archive. What can I
do for you?</prompt>
<grammar type=”application/srgs+xml” src=”requests”/>
<nomatch>
<goto next=”lecture.vxml”/>
</nomatch
<filled>
<submit next=”transport.cgi” namelist=”request”/>
</filled>
</field>
</form>
...

شکل شماره 4: شماتیکی از یک رابط محاوره‌ای با یک راه کار آغازین ترکیبی برای GUI است که در شکل شماره 1 نشان داده شده است.
1.3. تبدیل ساختاربندی متنی
در سیستم تبدیل محاوره صوتی، برنامه هدایتگر داخل متن می‌بایست نه تنها قادر به درک فصل‌ها و متون باشد بلکه می‌بایست توانایی درک کردن پاراگراف‌ها را نیر داشته باشد. عناصر هدایت کننده یا می‌توانند نام فصل یا متون یا در برخی موارد بعضی از قسمت‌هایی یک پاراگراف که خلاصه شده را مورد بررسی قرار دهند. عناصر هدایت کننده در داخل الگوی درختی سازماندهی شده است. دیگر روشهای بهینه سازی درخت‌ها در قسمت‌های بعدی مقاله توصیف خواهد شد [12, 13].
ساختمان درخت مورد نظر بر اساس الگوریتم تحقیقاتی مورد نظر در موارد ذیل مورد ارائه قرار می‌گیرد.
1. منابع شناساگر متنی ا باید به لیست متن‌های بازدید شده اضافه شود.
2. نودی طراحی شود که ارتباط دهنده متن‌ها باشد.
3. برای تمام فصل‌های موجود در صفحه:
1. نودی جدید با نام پوشه مورد نظر ساخته شده و درختی بهینه از فصل‌ها نیز ساخته شود.
2. به تمام پاراگراف‌ها یک توصیف کوتاه اضافه گردد و همچنین پاراگراف متنی به لیست پاراگراف‌ها اضافه شود.
3. درختی بهینه از پاراگراف‌ها ساخته و آن را به فصل مکاتبات اضافه کنید.
.4 برای تمام لینک‌های مهم خارج متن:
1. لینکی که داخل لیست لینک‌های بررسی شده و یا داخل خود لینک مهم نیست را می‌بایست بررسی کرد.
2. لینک هدف به لیست لینک‌های بررسی شده اضافه شود.
3. لینک داخل لیست باید به صفحه اضافه شود.
4. یک درخت بهینه باید در داخل صفحه بوجود آید.
5. درخت لینک باید به عنوان یک نود نزولی به صفحه اضافه شود.
5. اگر لیست نودهای بررسی شده خالی نباشد در این صورت از لینک اول برای شروع مرحله اول استفاده شود.
6. نتایج درخت را به شکل محاوره تبدیل کنید.
در این الگوریتم فرض می‌شود که همه اطلاعات مرتبط به مواد خاص تنها در یه شبکه قرار گرفته شده است.
آخرین مرحله انتقال متن ساختاری به محاوره‌ای تبدیلی از هدایت درخت به محاوره می‌باشد. هدایت محاوره شامل پیش صوت مکاتبه‌ای برای نودهای ورودی از هدایت درخت می‌باشد. لینک‌های موجود در فهرست موارد اشاره شده یا برای سطح بعدی از فهرست یا مستقیماً در داخل متن مکاتبه‌ای مورد استفاده قرار می‌گیرند [14].
دو امکان برای سازماندهی پیش صوت وجود دارد. دیالوگ هدایتی یا فقط در یک پوشه voiceXML یا در هر یک از پوشه‌های voiceXML بصورت جدا قرار می‌گیرد. اولین راه حل می‌تواند خیلی سریع اتفاق افتاده در صورتی که این راه حل در مقایسه با راه حل دیگه کمتر انعطاف پذیر می‌باشد. راه حل دوم انعطاف پذیری بیشتری را به محاوره می‌دهد تا بر طبق انتخاب یک کاربر اصلاح شود. در این مدل ما به راحتی می‌توانیم ترتیب آیتم‌هایی که به فهرست داده شده را تغییر دهیم. این روش همچنین به آهستگی زمان مورد نیاز برای اجرای صوت که به دلیل ارتباط بین صفحه voiceXML و سرور می‌باشد را افزایش می‌دهد. در هر دو مورد محاوره تولید شده شامل پیش صوت مکاتبه‌ای می‌باشد [15].
هر یک از پیش صوت‌ها هدایتی می‌تواند در استفاده از فهرست عناصر voiceXML مورد نقد قرار گیرد. از دیگر احتمالات نقد صوت‌های هدایتی ایجاد یک ساختار است که می‌تواند عناصر فهرست را مشخص کند. ایده گرامر برای کاربرهای تجربی آشنا به سیستم مناسب می‌باشد در حالیکه ایده فهرست دارای مزیت‌های برای کاربرها دارد تا کمک‌های زیادی را به آنها پیشنهاد دهد.
4. درخت فهرست بهینه:
فهرست موجود در voiceXML به ما این اجازه را می‌دهد تا یک مورد تکی از لیست تعیین شده انتخاب شود. عناصر مشابه در HTML که می‌توانند به عنوان فهرست voiceXML منتقل شوند شامل موارد زیر می‌باشند:
1. انتخاب (انتخاب عناصر، بدون گزینه‌های چندتایی)
2. دکمه رادیو (عنصر ورودی، نوع رادیو)
3. لیست لینک‌ها (عنصر a).
در فهرست‌های صوتی که از HTML به voiceXML تبدیل می‌شوند عامل زمان معنی دار می‌باشد. در این صورت به کاربر فشار وارد می‌شود تا آیتم‌های فهرست منظم شده خطی را بشنود. در دست یافته‌های خطی منظم اطلاعات اساساً در مقایسه با بررسی‌های دیداری آهسته‌تر می‌باشد. تصمیم گیرهای زمانی در مقایسه با زمان استفاده شده برای تلفظ یک مورد ناچیز می‌باشد. فهرستی که در منبع HTML استفاده می‌شود اغلب خیلی بزرگتر است بطوریکه می‌تواند یک مانع جدی برای درک سیستم زمانه تبدیل به voiceXML شود. در مواردی که در ادامه به آن اشاره می‌شود ما فهرست‌های اصلاح شده بزرگتری با استفاده از ساختاربندی کردن آنها ارائه می‌دهیم [16, 17].
مسئله دست یابی به یک ساختار بهینه بسیار حائز اهمیت بوده و می‌بایست مورد برررسی قرار گرفته شود. ]8،10[. دیدگاه ما از فهرست صوتی بر گرفته از موارد مختلف زیر می‌باشد.
1. آیتم‌های در دسترس فهرست صوتی دقیقاً خطی باشد. به عنوان مثال دستیابی به فهرست آیتم بدین گونه می‌باشد که کاربر می‌بایست تمام فهرست‌های قبلی را شنیده باشد.
2. زمان صرف شده برای دسترسی به اطلاعات فهرست آیتم قطعی فرض شده است. این موضوع به دلیل نیاز به شنیدن شکل صحبتی از فهرست آیتم می‌باشد.
3. کاربر قادر به ارائه یک ساختار متقارن در یک فهرست نمی‌باشد. در مقایسه، ما نشان می‌دهیم که در سناریو ما ساختارهای نامتقارن بهینه‌تر عمل می‌کند [3].
در مواردی که اشاره شد، ما فرض می‌گیریم که کاربر از یک استراتژی تحقیقی خود محدودی استفاده کرده است. در ادامه گذشته ازین مورد ما فرض می‌گیریم که تمام موارد فهرست در یک زمان برابر تلفظ می‌تواند استفاده شود. شاید این فرضیات بعضی از آیتم‌های فهرست را مختل نماید. اما این مورد به طور جدی بر روی نتایج تأثیر نخواهد گذاشت. خاطر نشان می‌شود که آیتم‌های فهرستی که باعث اختلال زیادی در این فرضیات شده همچنین باعث اختلال جدی در خود فهرست آیتم‌ها نیز می‌گردد [14].
بر اساس این فرضیات ما می‌توانیم این مسئله را براساس مدل‌های ریاضی ساختاربندی نماییم. این مدل برگ‌های درخت را به عنوان آیتم‌های فهرست در نظر می‌گیرد. و این ساختار مبین ساختار فهرست می‌باشد. ما تابع E(x) را معرفی می‌نماییم که نشان دهنده تعداد طبیعی برای درخت T می‌باشد. برای برگها درخت، این تعداد طبیعی بیان کننده زمان مورد نیاز برای دست یافتن به فهرست آیتم مکاتبه می‌باشد.
در اینجا T دستور دهنده برای درخت می‌باشد و x∈V(T) است. با این وجود E(x) ارزیابی ورتکس x را که به عنوان بازگشتی در موارد زیر تعریف شده است را مورد ارزیابی قرار داده است.
1. اگر x ریشه درخت T باشد، سپس
.
2. اگر و y باشد n-th جانشین ورتکس X باشد در این صورت
.
با این وجود، اگر l(T) یک دسته از برگ‌های درخت T منظم شده باشد آنگاه ارزیابی E(T) از درخت T توسط رابطه زیر تعریف می‌گردد.
زمانیکه تقسیم بندی‌ها با توجه به تعداد برگها انجام می‌گیرد E(T) بیان کننده دسترسی زمان برای فهرست مکاتبه‌ای برای درخت T می‌باشد.
یک درخت تنظیم شده T، E-minimal گفته می‌شود، اگر هر درخت ترتیب بندی شده T1 که دارای برگ‌های برابری با درخت T باشد. انگاه درخت T ارضا کننده E(T) ≤E(T1) می‌باشد. بنابراین، درخت‌های E-minimal فهرست بهینه را ارتباط می‌دهد.
شکل شماره 5: یک مثال از ارزیابی برگ درختان از یک درخت منظم شده.
اگر T یه درخت منظم شده باشد. در مواردی که در ادامه اشاره خواهد شد، ما می‌توانیم توسط LL(T) که یک دسته از تمام برگ‌های سمت چپ درخت T و یک دسته از تمام برگ‌های سمت چپ درخت را مورد بررسی قرار دهیم.
اصطلاحات: اگر یک درخت T E-minimal باشد آنگاه وضعیت‌های زیر پیش خواهد آمد.
1.
اگر که ورتکس x تنها دارای دو برگ باشد انگاه
3.
اثبات: اگر موقعیت 1 نقض شود، به عنوان مثال فرض می‌گیریم که x, y ∈LR(T) وجود داشته باشد. بطوریکه صورت گرفته و معادله زیر نتیجه می‌گردد.
(1). E(x) > E(y) + 1

اگر z جایگزین x باشد و w جایگزین y باشد. و اگر T1 درخت منظم شده باشد آنگاه با حذف زاویه‌های (z, x) از درخت T، زاویه‌های جدید (w, q) به عنوان جایگزین سمت راست زاویه w می‌شود. زمانیکه (z, x) حذف گردد آنگاه E(T1) از E(T)، بدست آید. این بدان معنی می‌باشد که ما می‌بایست E(X) را از E(T) کم کنیم و اضافه کردن (w, q) بدان معنی می‌باشد که ما می‌بایست E(y) + 1 را به معاده اضافه کنیم. بنابراین معادله زیر بدست می اید.
(2)
با این وجود از معادله‌های شماره‌های 1 و 2 می‌توان به این نتیجه رسید که E(T1)<E(T). این بدان معناست که اگر موقعیت شماره 1 مختل شود T، E-minimal نخواهد بود.
حال فرض بگیرید که موقعیت دوم جواب ندهد به عنوان مثال فرض بگیرید که x∈LR(T) و y∈LL(T) وجود داشته باشد در این صورت
(3).
حال اگر z جایگزین x شود و w نیز جایگزینی برای y. در این صورت T1 درخت منظمی خواهد بود که توسط حذف حاشیه‌های (z, x) و اضافه کردن دو تا حاشیه (y, q1) و (y, q2) از درخت T بدست می‌آید. زمانیکه E(T1) از E(T) محاسبه می‌گردد، حذف حاشیه‌های (z, x) بدین معنی است که ما می‌توانیم E(x) را از E(T) تفریق کنیم. اضافه کردن (y, q1) و (y, q2) به معادله بدین معنی می‌باشد که ما می‌بایست را به معادله اضافه کنیم و در این صورت E(y) (در صورتی که y یک برگ بزرگ در T1 نباشد) از معادله کم خواهد شد. بنابراین [17, 18]:
(4). =E(T) – E(x) + E(y) + 3.
همانطور که از معادله‌های 3 و 4 مشخص است ما می‌توانیم به راحتی نتیجه بگیریم که E(T1) < E(T) می‌باشد. با توجه به اینکه T1 و T دارای تعداد برگ‌های برابری می‌باشند. لذا ما می‌توانیم به این نتیجه برسیم که اگر موقعیت 2 جواب ندهد در این صورت T، E-minimal نخواهد بود.
حال اگر فرض بگیریم که رأس x دارای x1 و x2 باشد در این صورت موقعیت شماره 3 نقض می‌شود. به عنوان مثال:
(5).
برای یک رأس y∈LR(T) صادق می‌باشد. حال اگر w جایگزین y شود در این صورت T1 درخت منظمی می‌شود که توسط حذف زاویه‌های (x, x1)and (x, x2) و اضافه کردن زاویه (w, q) به عنوان مؤلفه‌های سمت راست زاویه w از T ساخته می‌شود. زمانیگه E(T1) از E(T) محاسبه گردد در این صورت، حذف (x, x1)and (x, x2) بدین معنی می‌باشد که ما می‌بایست E(x)+1 و E(x)+2 را از E(T) تفریق کرده و اگر x یکی از برگ‌های جدید در درخت T1 گردد در اینصورت E(x) به معادله اضافه می‌گردد. علاوه براین اگر (w, q) به معادله اضافه گردد این بدین معنی می‌باشد که ما می‌بایست E(y) + 1 را نیز به معادله اضافه نماییم. این بدین معنی می‌باشد که:
(6). = E(T) + E(y) – E(x) – 2
با این حال به راحتی می‌توان از معادله‌های 5 و 6 نتیجه گرفت که E(T1)<E(T) است زیرا T1 و T دارای تعداد برگ‌های برابری می‌باشند. حال اگر موقعیت شماره 3 نقض گردد در این صورت T، E-minimal نیست.
این تشریح از درخت E-minimal باعث یک محاسبه ساده از فهرست E-minimal برای برگ‌ها می‌شود. در حالت کلی، اصلاح فهرست می‌تواند با توجه به اضافه کردن یک سری گروه‌های توصیفی آیتم‌های فهرست ورودی را از آیتم‌های فهرست اصلی بر گرفته و اجرا نماید. حتی این مسئله می‌تواند یا بصورت دستی، زمانیکه یک سیستم محاوره‌ای صوتی از منابع شبکه‌ای ساخته می‌شود بر گرفته شود یا اینکه زمانیکه بطور اتوماتیک توسط آنالیز کردن آیتم‌های فهرست اصلی بدست می‌آید.

5. نتایج
در این تحقیق آزمایشی اینگونه فرض می‌شود که دسترسی به زمان برای فهرست آیتم‌ها تقریباً دارای تناسب مناسبی با تابع E(T) است. فهرست نشان داده شده در شکل 6 و متغییرهای بهینه آن در شکل 7 برای آزمایش کردن مورد استفاده قرار گرفته است. بطوریکه هر دوی فهرست‌ها دارای تعداد برگ‌های برابری می‌باشند.
تعداد افراد شرکت کننده در این آزمایش 11 نفر بودند که شامل 3 نفر خانم و 8 نفر آقا بودند. سن شرکت کنندگان در رنج سنی 19 تا 58 بود. برای اندازه گیری زمان، زمان واقعی برگشت داده شده توسط اندازه گیر یونیکس اندازه گیری شد. برای اجرای صفحه VoiceXML محاوره‌ای از سخن بهینه استفاده شد]18[.

شکل شماره 6: فهرست خطی استفاده شده در آزمایش.

شکل شماره 7: فهرست بهینه استفاده شده در آزمایش

نرخ متوسط بدست آمده بین زمان در دسترس برای فهرست خطی و بهینه 0.65 بود. این نتایج در شکل شماره 9 نمایش داده شده است. ما فرض می‌گیرم که تفاوت بین ارزش‌های اندازه گیری و تئوری دارای دلایل زیر می‌باشد [19].
1. وجود طول متفاوتی از آیتم‌های فهرست
2. بعضی از تاخیرهای غیر خطی به دلیل صحبت بهینه.
3. عکس العمل های زمانی متفاوت توسط کاربرها
4. بارگذاری کامپیوتر
5. بعضی از خطاها در اندازه گیری
پاراگراف موجود در شکل شماره 8 زمان موجود و تصور شده برای آیتم‌های فردی را در دو تا فهرست را مورد مقایسه قرار داده است.
شکل شماره 8: مقایسه متوسط زمان موجود برای آیتم‌های فردی
شکل شماره 9: متوسط زمان دردسترس برای فهرست خطی و بهینه

6. نتیجه گیری:
روش ارائه شده برای تبدیل سیستم‌های تحت شبکه به سیستم‌های محاوره‌ای صوتی ارائه دهنده تکنیک‌های برای ساخت صوت بر پایه سیستم‌های آموزش آغازین ترکیبی می‌باشد که برای افراد با ناتوانی بینایی و حرکتی بسیار مناسب می‌باشد. و در این مطالعه بهینه کردن فهرست ساختارها باعث تسریع و راحتی سیستم محاوره‌ای صوتی شده است.

7. References
[1] Annamalai, N. An Extensible Transcoder for HTML to VoiceXML Conversion, Master Thesis, University of Texas, Dalas, Texas, 2002
[2] Bártek, L. Automatic Generation of Dialogue Interaces for Web-Based Applications, In Text, Speech and Dialogue. Berlin Heidelberg: Springer-Verlag, LNAI 2166, 443-449, 2001
[3] Batušek, R., Kope ek, I., User Interfaces for Visually Impaired People, in Proceedings of the 5th ERCIM Workshop on User Interfaces for All, Dagstuhl, 167-173, 1999
[4] Fellbaum, C. (Edt), WordNet - An Electronic Lexical Database, Bradford Books, 1998
[5] Freire, J., Kumar, B., Lieuwen, D., WebViews: Accessing Personalized Web Content and Services, http://www10.org/cdrom/papers/220/
[6] Gross, J, Yellen, J. Graph Theory and its Applications, CRC Press, London 1999
[7] Hori, M., Kondoh, G., Ono, K., Hirose, S., Singhal, S. Annotation-Based Web Content Transcoding, http://www9.org/w9cdrom/169/169.html
[8] Jacko, J., Salvendy, G., Hierarchical Menu Design: Breadth, Depth, and Task Complexity, Perceptual and Motor Skills, 82, 1187-1201, 1996
[9] Kope ek, I., Speech Sciences and Visually Impaired Students Proceedings of Workshop on Method and Tool Innovations for Speech Science Education, University College London, 69-72, 1999
[10] Lee, E.S., Menu-Driven Systems, in The Encyclopedia of Microcomputers, Volume 11, A. Kent and J. G. Williams (eds.), 101-127, 1993
[11] Shao, Z., Capra, R., A. Perez-Quinones, M. A., Transcoding HTML to VoiceXML Using Annotation, In proceedings of 15thIEEE International Conference on Tools with Artificial Intelligence 2003, p.249
[12] Toms, M. L., Cummings-Hill, M. A., Curry, D. G., Cone, S. M., Using Cluster Analysis for Deriving Menu Structures for Automotive Mobile Multimedia Applications, SAE Technical Paper Series, 2001-01-0359
[13] Wirth. N., Algorithms + Data Structures = Programming, Prentices-Hall, New Jersey, 1976
[14] Zaphiris, P., Shneiderman, B., Norman, K. L., Expandable Indexes Versus Sequential Menus for Searching Hierarchies on the World Wide Web, Behaviour and Information Technology, 21 (3), 2002, 185-201, Tylor and Francis, London, UK.
[15] Hopson, N. WebSphere Transcoding Publisher,http://www 106.ibm.com/developerworks/websphere/library/techarticles/020 1_hopson/0201_hopson.html
[16] HTML 4.01 Specification, http://www.w3.org/TR/html4/
[17] Voice Extensible Markup Language (VoiceXML) Version 2.0, http://www.w3.org/TR/2004/REC-voiceXML20-20040316/
[18] Optimsys, OptimTalk Platform, http://www.optimtalk.cz/
[19] XML User Interface Language (XUL) Project, http://w