Bạn thường sẽ có nhu cầu truy cập dữ liệu nằm trên một máy chủ khác, cho dù bạn đang viết một bộ tổng hợp RSS trực tuyến hay đang thực hiện việc cạo màn hình cho một cơ chế tìm kiếm. PHP làm cho kéo dữ liệu này vào một biến chuỗi một quá trình cực kỳ đơn giản.
Bạn có thể đi với phương pháp thực sự ngắn:
$url = “https://www.howtogeek.com”;
$str = file_get_contents($url);
Vấn đề duy nhất với phương pháp đó là một số máy chủ web có quyền truy cập url bị chặn trong các phương pháp tệp, vì lý do bảo mật. Thay vào đó, bạn có thể sử dụng phương pháp workaround này:
function get_url_contents($url){ $crl = curl_init(); $timeout = 5; curl_setopt ($crl, CURLOPT_URL,$url); curl_setopt ($crl, CURLOPT_RETURNTRANSFER, 1); curl_setopt ($crl, CURLOPT_CONNECTTIMEOUT, $timeout); $ret = curl_exec($crl); curl_close($crl); return $ret; }
Bây giờ bạn sẽ có nội dung của trang web trong một biến chuỗi. Lưu ý rằng điều này không kéo các tệp hỗ trợ như javascript hoặc CSS. Bạn sẽ phải phân tích thêm trang và truy xuất chúng một cách riêng biệt nếu bạn cần toàn bộ.