1.اعظم محمد زاده 2. مهدی خلیلی
1-کارشناس ارشد مهندسی نرم افزار-تهران –ایران - edu@toolmaker.i r
2-مهدی خلیلی-استادیار دانشگاه پیام نور-تهران-ایران - m.khalili@pnu.ac.ir
کلیدواژه: تبدیل HTML به voiceXML،، تحت شبکه، سیستمهای صوتی، فهرست بهینه ساختار درختی، ناتوانی بینایی.
1. مقدمه:
در واقع در دهه 1980 استفاده از قالبهای گرافکی، صوت و تصویر در فایلهای متنی به سادگی امکانپذیر نبود و به همین دلیل کاربران نمیتوانستند از ابزارها و اطلاعات ارائه شده در سایتها به راحتی استفاده کنند. اما ظهور استاندارد اینترنتی HTML این روند را تغییر داد HTML(Hyper Text Markup Language) به معنای زبان نشانهگذاری فرامتن است. البته باید توجه داشت که HTML یک زبان برنامه نویسی نیست، زبانی است برای نشانه گذاری که برای تدوین قالب و طراحی صفحههای وب به کار میرود. این زبان به شما امکان میدهد متن را قالب دهی کنید، تصاویر گرافیکی، صوت و ویدیو را اضافه کنید و همه اینها را در یک فایل متنی که هر کامپیوتری میتواند آن را بخواند ذخیره کنید و سپس در صورت تمایل آنرا از طریق شبکه جهانی اینترنت با همه نیا به اشتراک بگذارید. اهداف اصلی اچتیامال ۵ بهبود این زبان به صورتی است که از جدیدترین فناوریهای چند رسانهای پشتیبانی کند در حالی که هم به راحتی توسط انسانها قابل خواندن باشد وهم به طور مداوم توسط رایانهها و دستگاهها (مرورگرهای وب، تجزیه کنندهها و غیره) قابل درک باشد. اچتیامال ۵ در نظر دارد نه تنها HTML4 بلکه XHTML۱ و ۲HTML را نیز پشتیبانی کند [1 and 2].
اچتیامال ۵ شامل جزئیات مدلهای پردازش است تا پیاده سازی سازگارتری داشته باشد. اچتیامال ۵ نشانه گذاری برای اسناد در دسترس را گسترش میدهد، بهبود میبخشد و توجیه میکند. هم چنین نشانه گذاری و رابط برنامه نویسی کاربردی (API ها) را برای برنامههای پیچیده تحت وب معرفی میکند. به همین دلیل، HTML5 کاندیدای بالقوه برای برنامههای کاربردی تلفن همراه کراس پلت فرم است [3]. بسیاری از ویژگیهای HTML۵ با در نظر گرفتن توانایی اجرا بر روی دستگاههای کم قدرت مانند گوشیهای هوشمند و تبلتها ساخته شدهاست. به طور خاص اچتیامال ۵ ویژگیهای نحوی بسیاری را به این زبان اضافه کردهاست. این ویژگیها عبارتند از عناصری مثل <audio>، <header>، <video> و <canvas>. هم چنین یکپارچه سازی محتوایی گرافیک برداری مقیاس پذیر (SVG) که جایگزین تگ <object> است. این ویژگیها برای این طراحی شدند تا وارد کردن و کار با محتوای چند رسانهای و گرافیکی آسانتر شود و به پلاگینهای اختصاصی و API ها نیازی نباشد. عناصرجدید دیگر مانند <nav> و <article>، <header>، <section> برای توانمندتر کردن محتوای نحوی اسناد طراحی شدهاند. صفتهای جدید دیگری نیز به همین منظور معرفی شدهاند، در حالی که برخی از عناصر و ویژگیها نیز حذف شدهاند [4]. با این وجود، برای بسیاری از دانش آموزان، خصوصاً افرادی با ناتوانی بینایی و حرکتی، دسترسی به شبکههای تحصیلی و واحدهای درسی ارائه شده برای ادامه تحصیل تبدیل به یک مشکل عظیم شده است. با توجه به افزایش سریع میزان اطلاعات در دسترس از طریق شبکه اهمیت دسترسی به شبکهها در حال افزایش است [2 and 5].
در این مقاله اصول و روشهایی ارائه خواهد شد که با استفاده از آن میتوان محتوای مطالعاتی دروس ارائه شده تحت وب را که به صورت زبان HTML کدبندی کرده و آن را به صورت سیستم استاندارد تلفنی و محاورهای voiceXML تغییر داد. بنابراین این مسئله، رابط کاربر گرافیکی را قادر میسازد تا بتواند اطلاعات مورد نظر را به شکل محاورهای تغییر شکل داده و به راحتی برای افراد با ناتوانی بینایی و حرکتی مناسب بوده و مورد استفاده قرار گیرد. همچنین در این مطالعه به برخی از مشکلات موجود در رابطه با تبدیل فهرستهای ابرمتنی HTML به شکل مناسبتر آن یعنی voiceXML که هدایت محاورهای را بهینهتر میسازد پرداخته خواهد شد. علاوه بر این در این مطالعه، تشریحی از فهرست درختی بهینه برای سیستمهای محاورهای و برخی از نتایج مطالعات مرتبط ارائه گردیده است [3].
2. نکات ابتدایی
در این مطالعه از تئوری گراف برای برخی از اصول پایهای استفاده شده است. یک گراف مستقیم گرافی است که دارای حاشیههای راست باشد. یک ساختار درختی مستقیم یک گراف راست میباشد که گراف پوشش دهنده آن یک درخت میباشد. یک درخت ریشه دار یک درخت مستقیم میباشد که دارای یک رأس متمایز به نام r میباشد که این همان ریشه نام نهاده میشود. در این صورت ریشه برای هر رأس دیگر همچون v مسیری مستقیم به رئوس r و v را خواهد داشت. بطوریکه اگر از رأس v ریشههای دوانده شود و از این ریشهها رئوس دیگر همچون w بدست آید در این صورت به اصطلاح w فرزند v خوانده میشود. یک درخت منظم یک درخت ریشه دار است که برای فرزندان هر رأس آن یک نظم ثابت مشخص شده است. در پایان اگر T یک گراف مستقیم باشد آنگاه تابع V (T) برگرداننده تمام رئوس T میباشد [6 and 7].
3. انتقال HTML به voiceXML
مهمترین رویکرد یا روش برای تبدیل رابط کاربر گرافیکی به یک رابط محاورهای که بر پایه تبدیل زبان توصیفی رابط کاربر گرافیکی از جمله (HTML, XUL,….) به یک زبان توصیفی محاورهای از جمله voiceXML است [1, 2,5,6] تفاوتهای ارتباطی بین بینایی و شنوایی باعث مشکلات فراوانی در این تحقیق شده است. به عنوان مثال: چگونگی دریافت انتقال بهینه توسط عناصر ورودی از طریق رابط کاربر گرافیکی یا چگونگی دست یابی به یک توصیف برای هر عنصر ورودی میباشند.
در این رابطه میتوان به دو روش مناسب برای تبدیل رابط کاربر گرافیکی اشاره کرد. اولاً، ما قادر هستیم تا تبدیلات را کم و بیش بصورت مستقیم به voiceXML داشته باشیم. که این مورد توسط انجام موارد زیر میسر میشود [8, 9].
1. در تبدیل مستقیم، عناصر با توجه به ترتیبی که در رابط کاربر گرافیکی نمایش داده میشود از بالا سمت چپ و از پایین سمت راست تبدیل میشوند. در این رابطه مثالی در شکل 1 نمایش داده شده است. همچنین بخشی از رابط محاورهای به عنوان نتیجه نیز در شکل شماره 2 نمایش داده شده است.
2. در تبدیل بهینه، ترتیب عناصر مورد نظر برای بهینه سازی طول رابط محاورهای مورد نظر تغییر داده میشود. نتایج محاوره ممکن است به دلیل تعداد کم نتایج سئوالات متوقف شود. در این راستا بخشی از رابط محاوره مرتبط در شکل شماره 3 نمایش داده شده است. محاورههای autumn.vxml و spring.vxml برای یکترم تحصیلی طوری سازگار گشته تا به کاربر اجازه وارد کردن موارد نامعتبر را ندهد.
شکل شماره 1: مثالی از رابط کابر گرافیکی مورد استفاده در تبدیل.
lecture.vxml
...
<form id=”lectureaccess”>
<field name=”lec”>
<prompt>Enter the lecture title</prompt>
<grammar type=”application/srgs+xml” src=”lectures”/>
</field>
<field name=”teach”>
<prompt>Enter teacher</prompt>
<grammar type=”application/srgs+xml” src=”teachers”/>
</field>
<field name=”sem”>
<prompt>Select semestr. Possible values are autumn or
spring.</prompt>
<grammar type=”application/srgs+xml”
src=”semester”/>
</field>
<block>
<prompt> Wait please. Your request is being processed.
</prompt>
<submit next=”some uri” namelist=”lec tech sem ”/>
</block>
</form>
شکل شماره 2: رابط محاورهای در تبدبل مستقیم.
در مرحله بعد، ما قادر هستیم تا یک شناسایی تبدیلی را در یک محاوره ترکیبی آغازین مورد بررسی قرار دهیم. در این حالت، سیستم تلاش میکند تا حد امکان تمام مقادیر گزینهها را از درخواست اولیه کاربرتشخیص دهد. لذا فرمان درخواست شده کاربر زمانی اجرا میشود که کاربر مقادیر مشخص شده را وارد کند. در غیر این صورت سیستم از کاربر درخواست میکند تا گزینهها را کامل کند [10].
lecture.vxml
...
<menu>
<prompt>Select the semestr</prompt>
<choice next=”http://localhost/autumn.vxml”>autumn
</choice>
<choice next=”http://localhost/spring.vxml”>spring
</choice>
</menu>
شکل شماره 3. شماتیکی از رابط محاورهای مربوط به تبدیل بهینه
حالتهای دیگر از این موضوع زمانی اتفاق می افتد که یک رابط محاورهای برای یک متن ساختارمند مورد نیاز باشد. مشکل تبدیل متن ساختاری به شکل محاورهای در بخش بعدی مورد بحث قرار گرفته است [11].
<form id=”requests”>
<field name=”request”>
<prompt>Welcome to lecture material archive. What can I
do for you?</prompt>
<grammar type=”application/srgs+xml” src=”requests”/>
<nomatch>
<goto next=”lecture.vxml”/>
</nomatch
<filled>
<submit next=”transport.cgi” namelist=”request”/>
</filled>
</field>
</form>
...
شکل شماره 4: شماتیکی از یک رابط محاورهای با یک راه کار آغازین ترکیبی برای GUI است که در شکل شماره 1 نشان داده شده است.
1.3. تبدیل ساختاربندی متنی
در سیستم تبدیل محاوره صوتی، برنامه هدایتگر داخل متن میبایست نه تنها قادر به درک فصلها و متون باشد بلکه میبایست توانایی درک کردن پاراگرافها را نیر داشته باشد. عناصر هدایت کننده یا میتوانند نام فصل یا متون یا در برخی موارد بعضی از قسمتهایی یک پاراگراف که خلاصه شده را مورد بررسی قرار دهند. عناصر هدایت کننده در داخل الگوی درختی سازماندهی شده است. دیگر روشهای بهینه سازی درختها در قسمتهای بعدی مقاله توصیف خواهد شد [12, 13].
ساختمان درخت مورد نظر بر اساس الگوریتم تحقیقاتی مورد نظر در موارد ذیل مورد ارائه قرار میگیرد.
1. منابع شناساگر متنی ا باید به لیست متنهای بازدید شده اضافه شود.
2. نودی طراحی شود که ارتباط دهنده متنها باشد.
3. برای تمام فصلهای موجود در صفحه:
1. نودی جدید با نام پوشه مورد نظر ساخته شده و درختی بهینه از فصلها نیز ساخته شود.
2. به تمام پاراگرافها یک توصیف کوتاه اضافه گردد و همچنین پاراگراف متنی به لیست پاراگرافها اضافه شود.
3. درختی بهینه از پاراگرافها ساخته و آن را به فصل مکاتبات اضافه کنید.
.4 برای تمام لینکهای مهم خارج متن:
1. لینکی که داخل لیست لینکهای بررسی شده و یا داخل خود لینک مهم نیست را میبایست بررسی کرد.
2. لینک هدف به لیست لینکهای بررسی شده اضافه شود.
3. لینک داخل لیست باید به صفحه اضافه شود.
4. یک درخت بهینه باید در داخل صفحه بوجود آید.
5. درخت لینک باید به عنوان یک نود نزولی به صفحه اضافه شود.
5. اگر لیست نودهای بررسی شده خالی نباشد در این صورت از لینک اول برای شروع مرحله اول استفاده شود.
6. نتایج درخت را به شکل محاوره تبدیل کنید.
در این الگوریتم فرض میشود که همه اطلاعات مرتبط به مواد خاص تنها در یه شبکه قرار گرفته شده است.
آخرین مرحله انتقال متن ساختاری به محاورهای تبدیلی از هدایت درخت به محاوره میباشد. هدایت محاوره شامل پیش صوت مکاتبهای برای نودهای ورودی از هدایت درخت میباشد. لینکهای موجود در فهرست موارد اشاره شده یا برای سطح بعدی از فهرست یا مستقیماً در داخل متن مکاتبهای مورد استفاده قرار میگیرند [14].
دو امکان برای سازماندهی پیش صوت وجود دارد. دیالوگ هدایتی یا فقط در یک پوشه voiceXML یا در هر یک از پوشههای voiceXML بصورت جدا قرار میگیرد. اولین راه حل میتواند خیلی سریع اتفاق افتاده در صورتی که این راه حل در مقایسه با راه حل دیگه کمتر انعطاف پذیر میباشد. راه حل دوم انعطاف پذیری بیشتری را به محاوره میدهد تا بر طبق انتخاب یک کاربر اصلاح شود. در این مدل ما به راحتی میتوانیم ترتیب آیتمهایی که به فهرست داده شده را تغییر دهیم. این روش همچنین به آهستگی زمان مورد نیاز برای اجرای صوت که به دلیل ارتباط بین صفحه voiceXML و سرور میباشد را افزایش میدهد. در هر دو مورد محاوره تولید شده شامل پیش صوت مکاتبهای میباشد [15].
هر یک از پیش صوتها هدایتی میتواند در استفاده از فهرست عناصر voiceXML مورد نقد قرار گیرد. از دیگر احتمالات نقد صوتهای هدایتی ایجاد یک ساختار است که میتواند عناصر فهرست را مشخص کند. ایده گرامر برای کاربرهای تجربی آشنا به سیستم مناسب میباشد در حالیکه ایده فهرست دارای مزیتهای برای کاربرها دارد تا کمکهای زیادی را به آنها پیشنهاد دهد.
4. درخت فهرست بهینه:
فهرست موجود در voiceXML به ما این اجازه را میدهد تا یک مورد تکی از لیست تعیین شده انتخاب شود. عناصر مشابه در HTML که میتوانند به عنوان فهرست voiceXML منتقل شوند شامل موارد زیر میباشند:
1. انتخاب (انتخاب عناصر، بدون گزینههای چندتایی)
2. دکمه رادیو (عنصر ورودی، نوع رادیو)
3. لیست لینکها (عنصر a).
در فهرستهای صوتی که از HTML به voiceXML تبدیل میشوند عامل زمان معنی دار میباشد. در این صورت به کاربر فشار وارد میشود تا آیتمهای فهرست منظم شده خطی را بشنود. در دست یافتههای خطی منظم اطلاعات اساساً در مقایسه با بررسیهای دیداری آهستهتر میباشد. تصمیم گیرهای زمانی در مقایسه با زمان استفاده شده برای تلفظ یک مورد ناچیز میباشد. فهرستی که در منبع HTML استفاده میشود اغلب خیلی بزرگتر است بطوریکه میتواند یک مانع جدی برای درک سیستم زمانه تبدیل به voiceXML شود. در مواردی که در ادامه به آن اشاره میشود ما فهرستهای اصلاح شده بزرگتری با استفاده از ساختاربندی کردن آنها ارائه میدهیم [16, 17].
مسئله دست یابی به یک ساختار بهینه بسیار حائز اهمیت بوده و میبایست مورد برررسی قرار گرفته شود. ]8،10[. دیدگاه ما از فهرست صوتی بر گرفته از موارد مختلف زیر میباشد.
1. آیتمهای در دسترس فهرست صوتی دقیقاً خطی باشد. به عنوان مثال دستیابی به فهرست آیتم بدین گونه میباشد که کاربر میبایست تمام فهرستهای قبلی را شنیده باشد.
2. زمان صرف شده برای دسترسی به اطلاعات فهرست آیتم قطعی فرض شده است. این موضوع به دلیل نیاز به شنیدن شکل صحبتی از فهرست آیتم میباشد.
3. کاربر قادر به ارائه یک ساختار متقارن در یک فهرست نمیباشد. در مقایسه، ما نشان میدهیم که در سناریو ما ساختارهای نامتقارن بهینهتر عمل میکند [3].
در مواردی که اشاره شد، ما فرض میگیریم که کاربر از یک استراتژی تحقیقی خود محدودی استفاده کرده است. در ادامه گذشته ازین مورد ما فرض میگیریم که تمام موارد فهرست در یک زمان برابر تلفظ میتواند استفاده شود. شاید این فرضیات بعضی از آیتمهای فهرست را مختل نماید. اما این مورد به طور جدی بر روی نتایج تأثیر نخواهد گذاشت. خاطر نشان میشود که آیتمهای فهرستی که باعث اختلال زیادی در این فرضیات شده همچنین باعث اختلال جدی در خود فهرست آیتمها نیز میگردد [14].
بر اساس این فرضیات ما میتوانیم این مسئله را براساس مدلهای ریاضی ساختاربندی نماییم. این مدل برگهای درخت را به عنوان آیتمهای فهرست در نظر میگیرد. و این ساختار مبین ساختار فهرست میباشد. ما تابع E(x) را معرفی مینماییم که نشان دهنده تعداد طبیعی برای درخت T میباشد. برای برگها درخت، این تعداد طبیعی بیان کننده زمان مورد نیاز برای دست یافتن به فهرست آیتم مکاتبه میباشد.
در اینجا T دستور دهنده برای درخت میباشد و x∈V(T) است. با این وجود E(x) ارزیابی ورتکس x را که به عنوان بازگشتی در موارد زیر تعریف شده است را مورد ارزیابی قرار داده است.
1. اگر x ریشه درخت T باشد، سپس
.
2. اگر و y باشد n-th جانشین ورتکس X باشد در این صورت
.
با این وجود، اگر l(T) یک دسته از برگهای درخت T منظم شده باشد آنگاه ارزیابی E(T) از درخت T توسط رابطه زیر تعریف میگردد.
زمانیکه تقسیم بندیها با توجه به تعداد برگها انجام میگیرد E(T) بیان کننده دسترسی زمان برای فهرست مکاتبهای برای درخت T میباشد.
یک درخت تنظیم شده T، E-minimal گفته میشود، اگر هر درخت ترتیب بندی شده T1 که دارای برگهای برابری با درخت T باشد. انگاه درخت T ارضا کننده E(T) ≤E(T1) میباشد. بنابراین، درختهای E-minimal فهرست بهینه را ارتباط میدهد.
شکل شماره 5: یک مثال از ارزیابی برگ درختان از یک درخت منظم شده.
اگر T یه درخت منظم شده باشد. در مواردی که در ادامه اشاره خواهد شد، ما میتوانیم توسط LL(T) که یک دسته از تمام برگهای سمت چپ درخت T و یک دسته از تمام برگهای سمت چپ درخت را مورد بررسی قرار دهیم.
اصطلاحات: اگر یک درخت T E-minimal باشد آنگاه وضعیتهای زیر پیش خواهد آمد.
1.
اگر که ورتکس x تنها دارای دو برگ باشد انگاه
3.
اثبات: اگر موقعیت 1 نقض شود، به عنوان مثال فرض میگیریم که x, y ∈LR(T) وجود داشته باشد. بطوریکه صورت گرفته و معادله زیر نتیجه میگردد.
(1). E(x) > E(y) + 1
اگر z جایگزین x باشد و w جایگزین y باشد. و اگر T1 درخت منظم شده باشد آنگاه با حذف زاویههای (z, x) از درخت T، زاویههای جدید (w, q) به عنوان جایگزین سمت راست زاویه w میشود. زمانیکه (z, x) حذف گردد آنگاه E(T1) از E(T)، بدست آید. این بدان معنی میباشد که ما میبایست E(X) را از E(T) کم کنیم و اضافه کردن (w, q) بدان معنی میباشد که ما میبایست E(y) + 1 را به معاده اضافه کنیم. بنابراین معادله زیر بدست می اید.
(2)
با این وجود از معادلههای شمارههای 1 و 2 میتوان به این نتیجه رسید که E(T1)<E(T). این بدان معناست که اگر موقعیت شماره 1 مختل شود T، E-minimal نخواهد بود.
حال فرض بگیرید که موقعیت دوم جواب ندهد به عنوان مثال فرض بگیرید که x∈LR(T) و y∈LL(T) وجود داشته باشد در این صورت
(3).
حال اگر z جایگزین x شود و w نیز جایگزینی برای y. در این صورت T1 درخت منظمی خواهد بود که توسط حذف حاشیههای (z, x) و اضافه کردن دو تا حاشیه (y, q1) و (y, q2) از درخت T بدست میآید. زمانیکه E(T1) از E(T) محاسبه میگردد، حذف حاشیههای (z, x) بدین معنی است که ما میتوانیم E(x) را از E(T) تفریق کنیم. اضافه کردن (y, q1) و (y, q2) به معادله بدین معنی میباشد که ما میبایست را به معادله اضافه کنیم و در این صورت E(y) (در صورتی که y یک برگ بزرگ در T1 نباشد) از معادله کم خواهد شد. بنابراین [17, 18]:
(4). =E(T) – E(x) + E(y) + 3.
همانطور که از معادلههای 3 و 4 مشخص است ما میتوانیم به راحتی نتیجه بگیریم که E(T1) < E(T) میباشد. با توجه به اینکه T1 و T دارای تعداد برگهای برابری میباشند. لذا ما میتوانیم به این نتیجه برسیم که اگر موقعیت 2 جواب ندهد در این صورت T، E-minimal نخواهد بود.
حال اگر فرض بگیریم که رأس x دارای x1 و x2 باشد در این صورت موقعیت شماره 3 نقض میشود. به عنوان مثال:
(5).
برای یک رأس y∈LR(T) صادق میباشد. حال اگر w جایگزین y شود در این صورت T1 درخت منظمی میشود که توسط حذف زاویههای (x, x1)and (x, x2) و اضافه کردن زاویه (w, q) به عنوان مؤلفههای سمت راست زاویه w از T ساخته میشود. زمانیگه E(T1) از E(T) محاسبه گردد در این صورت، حذف (x, x1)and (x, x2) بدین معنی میباشد که ما میبایست E(x)+1 و E(x)+2 را از E(T) تفریق کرده و اگر x یکی از برگهای جدید در درخت T1 گردد در اینصورت E(x) به معادله اضافه میگردد. علاوه براین اگر (w, q) به معادله اضافه گردد این بدین معنی میباشد که ما میبایست E(y) + 1 را نیز به معادله اضافه نماییم. این بدین معنی میباشد که:
(6). = E(T) + E(y) – E(x) – 2
با این حال به راحتی میتوان از معادلههای 5 و 6 نتیجه گرفت که E(T1)<E(T) است زیرا T1 و T دارای تعداد برگهای برابری میباشند. حال اگر موقعیت شماره 3 نقض گردد در این صورت T، E-minimal نیست.
این تشریح از درخت E-minimal باعث یک محاسبه ساده از فهرست E-minimal برای برگها میشود. در حالت کلی، اصلاح فهرست میتواند با توجه به اضافه کردن یک سری گروههای توصیفی آیتمهای فهرست ورودی را از آیتمهای فهرست اصلی بر گرفته و اجرا نماید. حتی این مسئله میتواند یا بصورت دستی، زمانیکه یک سیستم محاورهای صوتی از منابع شبکهای ساخته میشود بر گرفته شود یا اینکه زمانیکه بطور اتوماتیک توسط آنالیز کردن آیتمهای فهرست اصلی بدست میآید.
5. نتایج
در این تحقیق آزمایشی اینگونه فرض میشود که دسترسی به زمان برای فهرست آیتمها تقریباً دارای تناسب مناسبی با تابع E(T) است. فهرست نشان داده شده در شکل 6 و متغییرهای بهینه آن در شکل 7 برای آزمایش کردن مورد استفاده قرار گرفته است. بطوریکه هر دوی فهرستها دارای تعداد برگهای برابری میباشند.
تعداد افراد شرکت کننده در این آزمایش 11 نفر بودند که شامل 3 نفر خانم و 8 نفر آقا بودند. سن شرکت کنندگان در رنج سنی 19 تا 58 بود. برای اندازه گیری زمان، زمان واقعی برگشت داده شده توسط اندازه گیر یونیکس اندازه گیری شد. برای اجرای صفحه VoiceXML محاورهای از سخن بهینه استفاده شد]18[.
شکل شماره 6: فهرست خطی استفاده شده در آزمایش.
شکل شماره 7: فهرست بهینه استفاده شده در آزمایش
نرخ متوسط بدست آمده بین زمان در دسترس برای فهرست خطی و بهینه 0.65 بود. این نتایج در شکل شماره 9 نمایش داده شده است. ما فرض میگیرم که تفاوت بین ارزشهای اندازه گیری و تئوری دارای دلایل زیر میباشد [19].
1. وجود طول متفاوتی از آیتمهای فهرست
2. بعضی از تاخیرهای غیر خطی به دلیل صحبت بهینه.
3. عکس العمل های زمانی متفاوت توسط کاربرها
4. بارگذاری کامپیوتر
5. بعضی از خطاها در اندازه گیری
پاراگراف موجود در شکل شماره 8 زمان موجود و تصور شده برای آیتمهای فردی را در دو تا فهرست را مورد مقایسه قرار داده است.
شکل شماره 8: مقایسه متوسط زمان موجود برای آیتمهای فردی
شکل شماره 9: متوسط زمان دردسترس برای فهرست خطی و بهینه
6. نتیجه گیری:
روش ارائه شده برای تبدیل سیستمهای تحت شبکه به سیستمهای محاورهای صوتی ارائه دهنده تکنیکهای برای ساخت صوت بر پایه سیستمهای آموزش آغازین ترکیبی میباشد که برای افراد با ناتوانی بینایی و حرکتی بسیار مناسب میباشد. و در این مطالعه بهینه کردن فهرست ساختارها باعث تسریع و راحتی سیستم محاورهای صوتی شده است.
7. References
[1] Annamalai, N. An Extensible Transcoder for HTML to VoiceXML Conversion, Master Thesis, University of Texas, Dalas, Texas, 2002
[2] Bártek, L. Automatic Generation of Dialogue Interaces for Web-Based Applications, In Text, Speech and Dialogue. Berlin Heidelberg: Springer-Verlag, LNAI 2166, 443-449, 2001
[3] Batušek, R., Kope ek, I., User Interfaces for Visually Impaired People, in Proceedings of the 5th ERCIM Workshop on User Interfaces for All, Dagstuhl, 167-173, 1999
[4] Fellbaum, C. (Edt), WordNet - An Electronic Lexical Database, Bradford Books, 1998
[5] Freire, J., Kumar, B., Lieuwen, D., WebViews: Accessing Personalized Web Content and Services, http://www10.org/cdrom/papers/220/
[6] Gross, J, Yellen, J. Graph Theory and its Applications, CRC Press, London 1999
[7] Hori, M., Kondoh, G., Ono, K., Hirose, S., Singhal, S. Annotation-Based Web Content Transcoding, http://www9.org/w9cdrom/169/169.html
[8] Jacko, J., Salvendy, G., Hierarchical Menu Design: Breadth, Depth, and Task Complexity, Perceptual and Motor Skills, 82, 1187-1201, 1996
[9] Kope ek, I., Speech Sciences and Visually Impaired Students Proceedings of Workshop on Method and Tool Innovations for Speech Science Education, University College London, 69-72, 1999
[10] Lee, E.S., Menu-Driven Systems, in The Encyclopedia of Microcomputers, Volume 11, A. Kent and J. G. Williams (eds.), 101-127, 1993
[11] Shao, Z., Capra, R., A. Perez-Quinones, M. A., Transcoding HTML to VoiceXML Using Annotation, In proceedings of 15thIEEE International Conference on Tools with Artificial Intelligence 2003, p.249
[12] Toms, M. L., Cummings-Hill, M. A., Curry, D. G., Cone, S. M., Using Cluster Analysis for Deriving Menu Structures for Automotive Mobile Multimedia Applications, SAE Technical Paper Series, 2001-01-0359
[13] Wirth. N., Algorithms + Data Structures = Programming, Prentices-Hall, New Jersey, 1976
[14] Zaphiris, P., Shneiderman, B., Norman, K. L., Expandable Indexes Versus Sequential Menus for Searching Hierarchies on the World Wide Web, Behaviour and Information Technology, 21 (3), 2002, 185-201, Tylor and Francis, London, UK.
[15] Hopson, N. WebSphere Transcoding Publisher,http://www 106.ibm.com/developerworks/websphere/library/techarticles/020 1_hopson/0201_hopson.html
[16] HTML 4.01 Specification, http://www.w3.org/TR/html4/
[17] Voice Extensible Markup Language (VoiceXML) Version 2.0, http://www.w3.org/TR/2004/REC-voiceXML20-20040316/
[18] Optimsys, OptimTalk Platform, http://www.optimtalk.cz/
[19] XML User Interface Language (XUL) Project, http://w