پروتکل انتقال ابرمتن
منشور انتقال ابرمتن (به انگلیسی: Hypertext Transfer Protocol) (مخفف انگلیسی: HTTP) یک پروتکل لایهٔ کاربرد (Application Layer) برای سیستمهای توزیع شده میباشد. این پروتکل عمومی علاوه بر استفاده اصلی آن در ابرمتنها در بسیاری از زمینههای دیگر کامپیوتری مانند سامانهٔ نام دامنه (DNS) قابل استفاده است. از نسخه اولیه، این پروتکل در وب جهانی استفاده میشد و آخرین بهروزرسانی آن در ماه جون ۱۹۹۹ تحت عنوان «HTTP/1.1» صورت گرفت.[1]
استاندارد بین المللی | RFC 1945 HTTP/1.0 (1996) |
---|---|
توسعه یافته توسط | initially CERN; IETF, W3C |
تاریخ معرفی | ۱۹۹۱ |
مجموعه پروتکل اینترنت |
---|
لایه کاربرد |
لایه حمل |
لایه اینترنت |
لایه پیوند |
HTTP |
---|
روشهای درخواست |
زمینههای سرآیند |
|
کدهای وضعیت |
|
گسترش این پروتکل بر عهدهٔ نیروی ضربت مهندسی اینترنت (IETF) و کنسرسیوم وب جهانشمول (W3C)) است.
نسخه بعدی نیز HTTP/2 است که در سال ۲۰۱۵ استاندارد شد. HTTP/3 نیز که بر پایه استاندارهای HTTP/2 ساخته شدهاست جانشین آن شده و اکنون توسط میزان زیادی از وب سرورها و مرورگرها پشتیبانی میشود. HTTP/3 بر اساس انتقال لایه امنیتی (به انگلیسی: Transport Layer Security) (TLS) از یک افزونه منشور لایه کاربرد مجادله (به انگلیسی: Application-Layer Protocol Negotiation) (ALPN) که به TLS 1.2 یا بالاتر نیاز دارد کار میکند.
تاریخچه
تیم برنرز لی، طراح و پیشنهاد دهنده وب جهانی که اکنون تحت عنوان WWW شناخته میشود، برای اولین بار پروتکل انتقال ابرمتن را به همراه ساختار اولیهٔ زبان نشانهگذاری ابرمتن (HTML) در یک وب سرور ساده و یک مرورگر مبتنی بر متن ارائه داد. در این نسخهٔ اولیه تنها روش درخواست (Request Method) موجود GET و تمامی پاسخها به زبان HTML بودند.[2]
اولین نسخهٔ مستند پروتکل انتقال ابرمتن نسخهٔ ۰٫۹ آن بود که در سال ۱۹۹۱ منتشر شد.[2] دیو راگت، که در سال ۱۹۹۵ گروه کاری پروتکل انتقال ابرمتن (HTTP Working Group) را رهبری میکرد، خواستار گسترش این پروتکل شد و نهایتاً نسخه ۱٫۰ تحت عنوان «HTTP/1.0» در سال ۱۹۹۶ به صورت رسمی معرفی شد.[3][4]
گروه کاری این پروتکل در ژانویه سال ۱۹۹۷ اولین استاندارد نسخهٔ ۱٫۱ را که در همان زمان توسط بسیاری از مرورگرها پشتیبانی میشد،[5] به صورت رسمی منتشر کرد.[6] آخرین بهروزرسانی نسخهٔ ۱٫۱ در جون سال ۱۹۹۹ در درخواست شماره ۲۶۱۶ (RFC 2616) انجام شد.[1]
ساختار کلی
پروتکل انتقال ابرمتن یک پروتکل درخواست و پاسخ در مدل کلاینت–سرور میباشد. برای مثال یک مرورگر وب میتواند یک کلاینت و نرمافزار موجود بر روی سرویسدهندهٔ وبسایت، یک سرور باشد. شروع این پروتکل از طرف کلاینت است که با ارسال یک درخواست HTTP به سمت سرور گفتگو را آغاز میکند. سرور بر اساس درخواست ارسالی یا منبعی مانند یک فایل را در اختیار کلاینت میگذارد یا عملیات خاصی را انجام میدهد. نتیجهٔ این عملِ سرور در بستهٔ پاسخ HTTP برای کلاینت ارسال میشود. بستهٔ پاسخ شامل اطلاعات وضعیت و احتمالاً محتویات منبع درخواست شده میباشد.
مرورگر وب یک نمونه از عامل کاربر (به انگلیسی: User Agent) است. از دیگر عوامل کاربر میتوان به خزندهٔ وب، نرمافزارهای تلفنهای همراه و نرمافزارهای دیگری که به وب متصل شده و از اطلاعات آن استفاده یا صفحهای را نمایش میدهند، اشاره کرد.
پروتکل انتقال ابرمتن یک پروتکل لایهٔ کاربرد است که در مجموعه پروتکل اینترنت طراحی شده و مورد استفاده قرار میگیرد. این پروتکل با فرض اینکه لایهٔ حمل (Transport Layer) زیرین آن قابل اعتماد است طراحی شده و معمولاً از پروتکل هدایت انتقال (TCP) به عنوان لایهٔ زیرین استفاده میکند. با این حال از این پروتکل بر روی لایههای غیرقابل اطمینان نیز استفاده میشود. مثلاً در پروتکل SSDP، پروتکل انتقال ابرمتن بر روی پروتکل دادهنگار کاربر (یک پروتکل غیر امن) مورد استفاده قرار میگیرد.
منابع HTTP همگی با یک شناسانهٔ یکنواخت منبع (URI) یا بهطور مشخصتر با یک نشانی وب (URL) آدرسدهی و مشخص میشوند. تمامی این آدرسها با نشانهٔ http یا https آغاز میگردد. از این آدرسها در زبان نشانهگذاری ابرمتن به صورت گسترده برای انتقال بین صفحات مختلف استفاده میگردد و از آن تحت عنوان پیوند یا لینک یاد میشود.
نسخهٔ ۱٫۱ این پروتکل برخلاف نسخهٔ ۱٫۰ قابلیت استفاده از یک اتصال (به انگلیسی: Connection) برای چندین درخواست را دارد. مثلاً میتواند عکسها، فایلهای اسکریپت و … موجود در یک صفحه را با همان اتصال اولیه دریافت کند؛ لذا سرعت آن به دلیل حذف شدن برقراری ارتباط مجدد TCP نسبت به نسخهٔ ۱٫۰ افزایش یافتهاست.
جلسه
در پروتکل انتقال ابرمتن به دنبالهای از درخواستها و پاسخها جلسه (به انگلیسی: Session) گفته میشود. کلاینت با ایجاد یک اتصال هدایت انتقال (TCP) بر روی یک درگاهِ از پیش تعیین شده بر روی سرور (معمولاً درگاه شماره ۸۰؛ فهرست عددهای درگاه تیسیپی و یودیپی)، جلسه را آغاز میکند. سرور وب همواره بر روی درگاه در انتظار درخواستهای کلاینتها میباشد. بعد از دریافت درخواست ارسال شده، سرور با ارسال یک خط وضعیت (به انگلیسی: Status Line) و بدنه، پاسخ کلاینت را به او بازمیگرداند. بدنه بستهٔ پاسخ معمولاً حاوی منبع درخواست شدهاست؛ با این حال از آن برای ارسال خطا و اطلاعات دیگر نیز استفاده میشود.[1]
یک نمونه از خط وضعیت در پاسخ به یک درخواست مجاز:
HTTP/1.1 200 OK
روشهای درخواست
پروتکل انتقال ابرمتن روشهایی را برای درخواست تعریف کردهاست (به انگلیسی: Request Method)که هر کدام از آنها باعث انجام عمل خاص در سمت سرور میشوند. نسخهٔ ۱٫۰ روشهای درخواست GET, POST و HEAD را دارا بود.[7][بخش ۸] در نسخهٔ ۱٫۱ پنج روش جدید افزوده شد[1][بخش ۹]: OPTIONS, PUT, DELETE, TRACE و CONNECT. از آنجایی که عملکرد این روشها بهطور کامل تعریف و شرح داده شدهاست، لذا تمامی مرورگرها و سرورها به راحتی میتوانند این روشها را پیادهسازی و استفاده نمایند. اگر روشی برای سرور تعریف نشده باشد، با آن به عنوان یک روش غیرِامن برخورد خواهد کرد. در تعداد روشها هیچ محدودیتی وجود ندارد. این نکته باعث میشود که گسترش احتمالی این پروتکل در آینده به زیرساختها فعلی آن آسیبی نرساند و آنها را تغییر ندهد. برای مثال در حال حاضر پروتکل WebDAV هفت روش جدید درخواست را تعریف کردهاست.[8]
- GET
- درخواست نمایش منبعِ درخواستدادهشده را میدهد. (این منبع معمولاً یک فایل یا پرونده میباشد) این روش فقط اطلاعات را از سرور دریافت میکند و نباید هیچ تأثیری بر روی منابع سرور بگذارد.
- HEAD
- این روش دقیقاً مانند روش GET عمل میکند با این تفاوت که بدنه پاسخ را نمیخواهد. از این روش برای بهدستآوردن فرادادههای موجود در سرآیند (به انگلیسی: Header) استفاده میشود. یکی از استفادههای رایج این نوع درخواست، بررسی تغییر یافتن یک منبع است.
- POST
- در این روش به همراه بستهٔ درخواست اطلاعاتی نیز فرستاده میشود. سرور با توجه به نشانی وب (URL) درخواست شده و اطلاعات ارسال شده، منبع مورد نظر را در بستهٔ پاسخ برمیگرداند. این اطلاعات ارسالی میتواند نامِکاربری و کلمهٔعبور، یک نظر بر روی یک مطلب یا اطلاعات هر فرم دیگری که توسط کاربر وارد شدهاست، باشد.[1][بخش ۹٫۵]
- PUT
- در این روش منبعی به همراه بستهٔ درخواست ارسال شده و از سرور تقاضا میشود که این منبع را در آدرس موجود در بسته بارگذاری کند. اگر در محلِ درخواست شده قبلاً منبع دیگری قرار داشته باشد، منبع جدید جایگزین خواهد شد.
- DELETE
- از سرور درخواست میکند که آدرس فرستاده شده را حذف نماید.
- TRACE
- در این روش سرور اطلاعات ارسال شده را عیناً به کلاینت بازمیگرداند. (برای بررسی تغییراتی که واسطهای شبکه بر روی بسته میگذارند، از این روش استفاده میشود)
- OPTIONS
- از سرور تقاضا میکند تا روشهای درخواستِ (به انگلیسی: Request Method) موجود برای نشانی فرستاده شده را اعلام نماید. برای گرفتن تمامی روشهای درخواست قابل اجرا بر روی سرور میتوان از نشانی '*' استفاده کرد.
- CONNECT
- بستهٔ پروتکل ابرمتن را به یک تونل TCP/IP تبدیل میکند. این عمل معمولاً برای برقراری ارتباط امن (HTTPS) بر روی یک پراکسی سرور ناامن استفاده میشود.[9]
- PATCH
- این روش که در سال ۲۰۱۰ به پروتکل افزوده شد، برای ایجاد تغییرات جزیی بر روی منابع استفاده میشود.[8]
سرورهای وب موظف هستند حداقل روشهای GET و HEAD را پیادهسازی نمایند.[1][بخش ۵٫۱٫۱]
وضعیت جلسه
پروتکل انتقال ابرمتن یک پروتکل Stateless میباشد. بدین معنی که سرور در یک جلسه هیچ ردی از کاربر ذخیره نمیکند. بهطور مثال، سرور وب هیچگاه نمیتواند به یاد بیاورد که شما در این وبسایت لاگین کردهاید یا نه! اما به دلیل نیاز شدید نرمافزارهای تحت وب به ثبت وضعیت، با استفاده از تکنیکها زیر این عمل انجام میگیرد:
- کوکی
- استفاده از متغیرهای پنهان در فرمهای وب
- استفاده از متغیرهای موجود در رشتهٔ درخواست. مانند: index.php?session_id=some_unique_id
کدهای وضعیت
از نسخهٔ ۱٫۰ پروتکل انتقال ابرمتن به بعد، خطِ اولِ پاسخِ سرور تحت عنوان خط وضعیت شناخته شدهاست. این خط حاوی یک کد عددی (مانند ۴۰۴) که به عنوان کد وضعیت شناخته میشود و یک پیام متنی (مانند "یافت نشد" یا "Not Found") که با عنوان علت وضعیت شناخته میشود، میباشد. نحوهٔ برخورد عامل کاربر با پاسخ، بستگی کامل به کد وضعیت و فیلدهای سرآیند بستهٔ پاسخ دارد. با این حال استفاده از کدهای سفارشی (که در پروتکل اصلی موجود نیستند) نیز بلامانع میباشد. زیرا عوامل کاربر در برخورد با کدهای تعریف نشده، از رقم اول عدد آنها برای شناسایی نوع کلی کد استفاده میکنند.[1][بخش ۶٫۱]
کدهای وضعیت پروتکل انتقال ابرمتن به ۵ دستهٔ کلی تقسیم میشوند:
- کدهای 1xx یا اطلاعاتی: این کدها با عدد ۱ آغاز میشوند. این گروه، این پیام کلی را مشخص میکنند: «درخواست شما دریافت شد، ادامه دهید».
- کدهای 2xx یا موفقیت: این کدها با عدد ۲ آغاز میشوند. یعنی «درخواستِ ارسالی دریافت شده، درک شده، پذیرفته شده و با موفقیت انجام شدهاست».
- کدهای 3xx یا تغییر مسیر: این کدها با عدد ۳ آغاز میشوند. یعنی «کلاینت برای کامل شدن درخواست نیازمند انجام عملیات اضافی است».
- کدهای 4xx یا خطای کلاینت: این کدها با عدد ۴ آغاز میشوند. این گروه از کدها مشخص میکنند که «کلاینت در درخواست خود اشتباه کرده یا باعث بروز خطا شدهاست».
- کدهای 5xx یا خطای سرور: این کدها با عدد ۵ آغاز میشوند. با این مفهوم که «سرور در انجام عملیات مربوط به یک بستهٔ درخواستِ ظاهراً صحیح، ناموفق بوده و با خطا مواجه شدهاست».
علت وضعیتهایی که در متن تعریف پروتکل آمدهاند پیشنهادی بوده و میتوانند با متون دیگر، به صلاحِ دید توسعه دهنده، تغییر پیدا کنند. این عبارت میتواند توسط عامل کاربر به عنوان توضیحات اضافی به کاربر نمایش داده شود.
مثال
در زیر مثالی از یک جلسه بین یک کلاینت HTTP و یک سرور HTTP که بر روی www.wikipedia.com قرار دارد، ارائه شدهاست.
درخواست کلاینت
GET /index.html HTTP/1.1 Host: www.wikipedia.com35.545325,51.238591
در درخواست کلاینت، خط اول روش، نشانی و نسخهٔ پروتکل استفاده شده در درخواست را مشخص میکند. از خط دوم هر خط حاوی یک فیلد سرآیند (به انگلیسی: Header Field) میباشد و این فیلدها با یک خط خالی به پایان میرسند. پایان هر خط در این پروتکل با ۲ حرف Carriage Return و Line Feed پشتِسرهم مشخص میشود. (r\n\)
پاسخ سرور
HTTP/1.1 200 OK Date: Mon, ۲۳ مه ۲۰۰۵ ۲2:38:34 GMT Server: Apache/1.3.3.7 (Unix) (Red-Hat/Linux) Last-Modified: Wed, ۰۸ ژانویه ۲۰۰۳ ۲3:11:55 GMT Content-Type: text/html; charset=UTF-8 Content-Length: 131 Connection: close
<html> <head> <title>An Example Page</title> </head> <body> Hello World, this is a very simple HTML document. </body> </html>
در پاسخ سرور، خط اول، که خط وضعیت نامیده میشود، یکی از وضعیتهای تعریف شده در پروتکل را مشخص میکند. در اینجا کد وضعیت ۲۰۰ به معنای صحیح و مجاز بودن درخواست میباشد. از خط دوم، هر خط حاوی یک فیلد سرآیند (به انگلیسی: Header Field) پاسخ است. این فیلدها با یک خط خالی به پایان میرسند. پایان هر خط نیز مانند بستهٔ درخواست با ۲ حرف Carriage Return و Line Feed پشتِسرِهم مشخص میشود. بعد از یک خط خالی (که به معنای پایان فیلدهای سرآیند است)، بدنه پاسخ آغاز میشود. طول بدنهٔ پاسخ معمولاً در فیلد سرآیند Content-Length توسط سرور مشخص میشود. در صورتی که این فیلد مشخص نشود، اطلاعات ارسالی تا بسته شدن کامل ارتباط، بدنهٔ پاسخ محسوب خواهند شد.
جستارهای وابسته
HTTP |
---|
روشهای درخواست |
زمینههای سرآیند |
|
کدهای وضعیت |
|
منابع
- مشارکتکنندگان ویکیپدیا. «Hypertext Transfer Protocol». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۳۰ فروردین ۱۳۹۲.
- «وبسایت رسمی نیروی ضربت مهندسی اینترنت». دریافتشده در ۳۰ فروردین ۱۳۹۲.
- «وبسایت رسمی کنسرسیوم وب». دریافتشده در ۳۰ فروردین ۱۳۹۲.
پانویس
- «RFC 2616 - HTTP/1.1». نیروی ضربت مهندسی اینترنت. جون ۱۹۹۹.
- «نسخهٔ اولیهٔ HTTP». کنسرسیوم وب.
- «زندگینامهٔ دیو راگر».
- «برنامهریزی گروه کاری HTTP در سال ۱۹۹۵».
- «توضیحات پیشرفت پروتکل انتقال ابرمتن نسل جدید». کنسرسیوم وب.
- گروه کاری پروتکل انتقال ابرمتن (ژانویه ۱۹۹۷). «RFC 2068». نیروی ضربت مهندسی اینترنت.
- «RFC 1945 - HTTP/1.0». نیروی ضربت مهندسی اینترنت.
- «RFC 5789». نیروی ضربت مهندسی اینترنت. مارچ ۲۰۱۰. تاریخ وارد شده در
|تاریخ=
را بررسی کنید (کمک) - «RFC 2817 - Upgrading to TLS Within HTTP/1.1"». نیروی ضربت مهندسی اینترنت. سال ۲۰۰۰. تاریخ وارد شده در
|تاریخ=
را بررسی کنید (کمک)