我爲一個網站創建了一個rss feed,但它有2種語言 - 希臘語和英語。 當一個項目有一個用希臘語寫的標題時,一切正常,除了rss提要。php rss feed字符編碼多種語言的feed項目
所以我雖然好,我必須在解析字符串之前更改編碼。我失敗了100%。
我試過每個編碼函數php提供的:iconv,ut8_encode,mb_convert_encoding也mb_detect_encoding嚴格而不是。我也用HTML實體,但似乎沒有任何工作
的源代碼生成RSS是這樣的:
function construct_rss($results, $cat = null)
{
if($results == false)
{
exit;
}
header('Content-Type: application/rss+xml charset=UTF-8');
$rssfeed = '<?xml version="1.0" encoding="utf-8" ?>';
$rssfeed .= '<rss version="2.0">';
$rssfeed .= '<channel>';
$rssfeed .= '<title>domain.com RSS feed</title>';
$rssfeed .= '<link>http://www.domain.com</link>';
if($cat == null)
{
$rssfeed .= '<description>Upcoming events</description>';
}
else
{
$rssfeed .= '<description>Upcoming events - ' . $cat . '</description>';
}
$rssfeed .= '<language>en-us</language>';
$rssfeed .= '<copyright>Copyright (C) 2012 domain.com</copyright>';
foreach ($results as $key => $event)
{
$exp = explode(',',$event['vName']);
$vName = $exp[0];
$rssfeed .= '<item>';
$rssfeed .= '<title>' . $event['eTitle'] . ' @ ' . $vName . '</title>';
$rssfeed .= '<description>' . htmlentities('<a href="http://www.domain.com/event.php?eid=' . $event['id'] .'"><img WIDTH="150" HEIGHT="220" style="width:150px;height:220px;padding-bottom:10px;padding-right:10px;" src="http://'.$_SERVER['SERVER_NAME'].'/image.php?source='.urlencode('events/'.$event['folder'].'/images/default/' . $event['file_1']).'&w=150&h=220&out=raw"></a>' . '<p>' . $event['eDescr'] . '</div>') . '</description>';
$rssfeed .= '<link>http://www.'.$_SERVER['SERVER_NAME'].'/events/' . urlencode($event['eCategory']) . '/' .urlencode($event['url']). '</link>';
$rssfeed .= '<pubDate>' . date("D, d M Y H:i:s O", strtotime($event['dStart'] . ' ' . $event['tStart'])) . '</pubDate>';
$rssfeed .= '</item>';
}
$rssfeed .= '</channel>';
$rssfeed .= '</rss>';
echo $rssfeed;
}
這裏是一個原始輸出:
<?xml version="1.0" encoding="utf-8" ?><rss version="2.0">
<channel>
<title>domain.com RSS feed</title>
<link>http://www.domai.com</link>
<description>Upcoming events</description>
<language>en-us</language><copyright>Copyright (C) 2012 domain.com</copyright>
<item>
<title>ΕΙΣΒΟΛΕΑΣ & EVERSOR - O μÏθος καταÏÏÎει @ Gagarin 205 Live Music Space</title>
<description><a href="http://www.domain.com/event.php?eid=209"><img WIDTH="150" HEIGHT="220" style="width:150px;height:220px;padding-bottom:10px;padding-right:10px;" src="http://www.comain.com/image.php?source=events%2F985d6bfa8e35df69471b1ecdb9ed187e%2Fimages%2Fdefault%2Feisvo.jpg&w=150&h=220&out=raw"></a><p><p><span style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;">&Epsilon;&Iota;&Sigma;&Beta;&Omicron;&Lambda;&Epsilon;&Alpha;&Sigma; &amp; EVERSOR - "&Omicron; &Mu;&Upsilon;&Theta;&Omicron;&Sigma; &Kappa;&Alpha;&Tau;&Alpha;&Rho;&Rho;&Epsilon;&Epsilon;&Iota;" TOUR LIVE @ &Alpha;&Theta;&Eta;&Nu;&Alpha; (GAGARIN205), &Sigma;&Alpha;&Beta; 22/12</span><br style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;" /><br style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;" /><span style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;">doors open: 20.00</span><br style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;" /><span style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;">ticket price: 10e</span><br style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;" /><span style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;">guests: 12os Pithikos &amp; Hatemost</span><br style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;" /><span style="color: #333333; font-family: lucida grande, tahoma, verdana, arial, sans-serif; font-size: 13px; line-height: 16px;">opening: Gelws</span></p></div></description><link>http://www.www.domain.com/events/Hip-Hop+Rap/%CE%95%CE%99%CE%A3%CE%92%CE%9F%CE%9B%CE%95%CE%91%CE%A3-EVERSOR-%CE%9F-%CE%9C%CE%A5%CE%98%CE%9F%CE%A3-%CE%9A%CE%91%CE%A4%CE%91%CE%A1%CE%A1%CE%95%CE%95%CE%99-0</link>
<pubDate>Sat, 22 Dec 2012 20:00:00 +0200</pubDate>
</item>
</channel>
</rss>
正如你所看到的問題在於該項目的標題。
如果任何人都可以指向一個方向或什麼,因爲我無法弄清楚這一個。我想通過轉換$event['eTitle']
編碼它會工作,但沒有運氣。
編輯:存儲在數據庫爲TEXT utf8_general_ci
編輯2:這似乎工作 - >
utf8_encode(htmlentities($event['eTitle'],ENT_COMPAT,'utf-8'))
但W3C驗證我得到這個錯誤:塔268: XML解析錯誤:1:268:未定義實體
這裏是突出顯示的部分:
EVERSOR - O μÃ\x8fÂ\x8dθ
\ x8f和\ x8d會導致此錯誤。但爲什麼?
字段如何存儲在數據庫中? –
text utf8_general_ci – Syd
'ΕΙΣΒΟΛΕΑΣ&EVERSOR - OμЎࠏκαταЏέει@ Gagarin 205 Live Music Space' 看起來(大部分)都對我很好。你用什麼來查看輸出? (我用記事本++和設置編碼 - > UTF8) –