揭露PHP應用程式中出現的五個常見
資料庫問題——包括資料庫模式設計、資料庫訪問和使用資料庫的業務邏輯代碼——以及它們的解決方案。
如果只有一種方式使用資料庫是正確的……
您可以用很多的方式創建資料庫設計、資料庫訪問和基於資料庫的PHP業務邏輯代碼,但最終一般以錯誤告終。本文說明了資料庫設計和訪問資料庫的PHP代碼中出現的五個常見問題,以及在遇到這些問題時如何修復它們。
問題1:直接使用MySQL一個常見問題是較老的PHP代碼直接使用mysql_函數來訪問資料庫。清單1展示了如何直接訪問資料庫。
清單1.Access/get.php
<?php
functionget_user_id($name)
{
$db=mysql_connect('localhost','root','password');
mysql_select_db('users');
$res=mysql_query("SELECTidFROMusersWHERElogin='".$name."'");
while($row=mysql_fetch_array($res)){$id=$row[0];}
return$id;
}
var_dump(get_user_id('jack'));
?>
注意使用了mysql_connect函數來訪問資料庫。還要注意查詢,其中使用字符串連接來向查詢添加$name參數。
該技術有兩個很好的替代方案:PEARDB模塊和PHPDataObjects(PDO)類。兩者都從特定資料庫選擇提供抽象。因此,您的代碼無需太多調整就可以在IBM?DB2?、MySQL、PostgreSQL或者您想要連接到的任何其他資料庫上運行。
使用PEARDB模塊和PDO抽象層的另一個價值在於您可以在SQL語句中使用?操作符。這樣做可使SQL更加易於維護,且可使您的應用程式免受SQL注入攻擊。
使用PEARDB的替代代碼如下所示。
清單2.Access/get_good.php
<?php
require_once("DB.php");
functionget_user_id($name)
{
$dsn='mysql://root:password@localhost/users';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$res=$db->query('SELECTidFROMusersWHERElogin=?',array($name));
$id=null;
while($res->fetchInto($row)){$id=$row[0];}
return$id;
}
var_dump(get_user_id('jack'));
?>
注意,所有直接用到MySQL的地方都消除了,只有$dsn中的資料庫連接字符串除外。此外,我們通過?操作符在SQL中使用$name變量。然後,查詢的數據通過query()方法末尾的array被發送進來。
問題2:不使用自動增量功能與大多數現代資料庫一樣,MySQL能夠在每記錄的基礎上創建自動增量惟一標識符。除此之外,我們仍然會看到這樣的代碼,即首先運行一個SELECT語句來找到最大的id,然後將該id增1,並找到一個新記錄。清單3展示了一個示例壞模式。
清單3.Badid.sql
DROPTABLEIFEXISTSusers;
CREATETABLEusers(
idMEDIUMINT,
loginTEXT,
passwordTEXT
);
INSERTINTOusersVALUES(1,'jack','pass');
INSERTINTOusersVALUES(2,'joan','pass');
INSERTINTOusersVALUES(1,'jane','pass');
這裡的id欄位被簡單地指定為整數。所以,儘管它應該是惟一的,我們還是可以添加任何值,如CREATE語句後面的幾個INSERT語句中所示。清單4展示了將用戶添加到這種類型的模式的PHP代碼。
清單4.Add_user.php
<?php
require_once("DB.php");
functionadd_user($name,$pass)
{
$rows=array();
$dsn='mysql://root:password@localhost/bad_badid';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$res=$db->query("SELECTmax(id)FROMusers");
$id=null;
while($res->fetchInto($row)){$id=$row[0];}
$id+=1;
$sth=$db->prepare("INSERTINTOusersVALUES(?,?,?)");
$db->execute($sth,array($id,$name,$pass));
return$id;
}
$id=add_user('jerry','pass');
var_dump($id);
?>
add_user.php中的代碼首先執行一個查詢以找到id的最大值。然後文件以id值加1運行一個INSERT語句。該代碼在負載很重的伺服器上會在競態條件中失敗。另外,它也效率低下。
那麼替代方案是什麼呢?使用MySQL中的自動增量特性來自動地為每個插入創建惟一的ID。更新後的模式如下所示。
清單5.Goodid.php
DROPTABLEIFEXISTSusers;
CREATETABLEusers(
idMEDIUMINTNOTNULLAUTO_INCREMENT,
loginTEXTNOTNULL,
passwordTEXTNOTNULL,
PRIMARYKEY(id)
);
INSERTINTOusersVALUES(null,'jack','pass');
INSERTINTOusersVALUES(null,'joan','pass');
INSERTINTOusersVALUES(null,'jane','pass');
我們添加了NOTNULL標誌來指示欄位必須不能為空。我們還添加了AUTO_INCREMENT標誌來指示欄位是自動增量的,添加PRIMARYKEY標誌來指示那個欄位是一個id。這些更改加快了速度。清單6展示了更新後的PHP代碼,即將用戶插入表中。
清單6.Add_user_good.php
<?php
require_once("DB.php");
functionadd_user($name,$pass)
{
$dsn='mysql://root:password@localhost/good_genid';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$sth=$db->prepare("INSERTINTOusersVALUES(null,?,?)");
$db->execute($sth,array($name,$pass));
$res=$db->query("SELECTlast_insert_id()");
$id=null;
while($res->fetchInto($row)){$id=$row[0];}
return$id;
}
$id=add_user('jerry','pass');
var_dump($id);
?>
現在我不是獲得最大的id值,而是直接使用INSERT語句來插入數據,然後使用SELECT語句來檢索最後插入的記錄的id。該代碼比最初的版本及其相關模式要簡單得多,且效率更高。
#p#分頁標題#e#
問題3:使用多個資料庫
偶爾,我們會看到一個應用程式中,每個表都在一個單獨的資料庫中。在非常大的資料庫中這樣做是合理的,但是對於一般的應用程式,則不需要這種級別的分割。此外,不能跨資料庫執行關係查詢,這會影響使用關係資料庫的整體思想,更不用說跨多個資料庫管理表會更困難了。那麼,多個資料庫應該是什麼樣的呢?首先,您需要一些數據。清單7展示了分成4個文件的這樣的數據。
清單7.資料庫文件
Files.sql:
CREATETABLEfiles(
idMEDIUMINT,
user_idMEDIUMINT,
nameTEXT,
pathTEXT
);
Load_files.sql:
INSERTINTOfilesVALUES(1,1,'test1.jpg','files/test1.jpg');
INSERTINTOfilesVALUES(2,1,'test2.jpg','files/test2.jpg');
Users.sql:
DROPTABLEIFEXISTSusers;
CREATETABLEusers(
idMEDIUMINT,
loginTEXT,
passwordTEXT
);
Load_users.sql:
INSERTINTOusersVALUES(1,'jack','pass');
INSERTINTOusersVALUES(2,'jon','pass');
在這些文件的多資料庫版本中,您應該將SQL語句加載到一個資料庫中,然後將usersSQL語句加載到另一個資料庫中。用於在資料庫中查詢與某個特定用戶相關聯的文件的PHP代碼如下所示。
清單8.Getfiles.php
<?php
require_once("DB.php");
functionget_user($name)
{
$dsn='mysql://root:password@localhost/bad_multi1';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$res=$db->query("SELECTidFROMusersWHERElogin=?",array($name));
$uid=null;
while($res->fetchInto($row)){$uid=$row[0];}
return$uid;
}
functionget_files($name)
{
$uid=get_user($name);
$rows=array();
$dsn='mysql://root:password@localhost/bad_multi2';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$res=$db->query("SELECT*FROMfilesWHEREuser_id=?",array($uid));
while($res->fetchInto($row)){$rows[]=$row;}
return$rows;
}
$files=get_files('jack');
var_dump($files);
?>
get_user函數連接到包含用戶表的資料庫並檢索給定用戶的ID。get_files函數連接到文件表並檢索與給定用戶相關聯的文件行。
做所有這些事情的一個更好辦法是將數據加載到一個資料庫中,然後執行查詢,比如下面的查詢。
清單9.Getfiles_good.php
<?php
require_once("DB.php");
functionget_files($name)
{
$rows=array();
$dsn='mysql://root:password@localhost/good_multi';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$res=$db->query("SELECTfiles.*FROMusers,filesWHERE
users.login=?ANDusers.id=files.user_id",
array($name));
while($res->fetchInto($row)){$rows[]=$row;}
return$rows;
}
$files=get_files('jack');
var_dump($files);
?>
該代碼不僅更短,而且也更容易理解和高效。我們不是執行兩個查詢,而是執行一個查詢。
儘管該問題聽起來有些牽強,但是在實踐中我們通常總結出所有的表應該在同一個資料庫中,除非有非常迫不得已的理由。
#p#分頁標題#e#
問題4:不使用關係
關係資料庫不同於程式語言,它們不具有數組類型。相反,它們使用表之間的關係來創建對象之間的一到多結構,這與數組具有相同的效果。我在應用程式中看到的一個問題是,工程師試圖將資料庫當作程式語言來使用,即通過使用具有逗號分隔的標識符的文本字符串來創建數組。請看下面的模式。
清單10.Bad.sql
DROPTABLEIFEXISTSfiles;
CREATETABLEfiles(
idMEDIUMINT,
nameTEXT,
pathTEXT
);
DROPTABLEIFEXISTSusers;
CREATETABLEusers(
idMEDIUMINT,
loginTEXT,
passwordTEXT,
filesTEXT
);
INSERTINTOfilesVALUES(1,'test1.jpg','media/test1.jpg');
INSERTINTOfilesVALUES(2,'test1.jpg','media/test1.jpg');
INSERTINTOusersVALUES(1,'jack','pass','1,2');
系統中的一個用戶可以具有多個文件。在程式語言中,應該使用數組來表示與一個用戶相關聯的文件。在本例中,程式設計師選擇創建一個files欄位,其中包含一個由逗號分隔的文件id列表。要得到一個特定用戶的所有文件的列表,程式設計師必須首先從用戶表中讀取行,然後解析文件的文本,並為每個文件運行一個單獨的SELECT語句。該代碼如下所示。
清單11.Get.php
<?php
require_once("DB.php");
functionget_files($name)
{
$dsn='mysql://root:password@localhost/bad_norel';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$res=$db->query("SELECTfilesFROMusersWHERElogin=?",array($name));
$files=null;
while($res->fetchInto($row)){$files=$row[0];}
$rows=array();
foreach(split(',',$files)as$file)
{
$res=$db->query("SELECT*FROMfilesWHEREid=?",
array($file));
while($res->fetchInto($row)){$rows[]=$row;}
}
return$rows;
}
$files=get_files('jack');
var_dump($files);
?>
該技術很慢,難以維護,且沒有很好地利用資料庫。惟一的解決方案是重新架構模式,以將其轉換回到傳統的關係形式,如下所示。
清單12.Good.sql
DROPTABLEIFEXISTSfiles;
CREATETABLEfiles(
idMEDIUMINT,
user_idMEDIUMINT,
nameTEXT,
pathTEXT
);
DROPTABLEIFEXISTSusers;
CREATETABLEusers(
idMEDIUMINT,
loginTEXT,
passwordTEXT
);
INSERTINTOusersVALUES(1,'jack','pass');
INSERTINTOfilesVALUES(1,1,'test1.jpg','media/test1.jpg');
INSERTINTOfilesVALUES(2,1,'test1.jpg','media/test1.jpg');
這裡,每個文件都通過user_id函數與文件表中的用戶相關。這可能與任何將多個文件看成數組的人的思想相反。當然,數組不引用其包含的對象——事實上,反之亦然。但是在關係資料庫中,工作原理就是這樣的,並且查詢也因此要快速且簡單得多。清單13展示了相應的PHP代碼。
清單13.Get_good.php
<?php
require_once("DB.php");
functionget_files($name)
{
$dsn='mysql://root:password@localhost/good_rel';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
$rows=array();
$res=$db->query("SELECTfiles.*FROMusers,filesWHEREusers.login=?
ANDusers.id=files.user_id",array($name));
while($res->fetchInto($row)){$rows[]=$row;}
return$rows;
}
$files=get_files('jack');
var_dump($files);
?>
這裡,我們對資料庫進行一次查詢,以獲得所有的行。代碼不複雜,並且它將資料庫作為其原有的用途使用。
#p#分頁標題#e#
問題5:n+1模式
我真不知有多少次看到過這樣的大型應用程式,其中的代碼首先檢索一些實體(比如說客戶),然後來回地一個一個地檢索它們,以得到每個實體的詳細信息。我們將其稱為n+1模式,因為查詢要執行這麼多次——一次查詢檢索所有實體的列表,然後對於n個實體中的每一個執行一次查詢。當n=10時這還不成其為問題,但是當n=100或n=1000時呢?然後肯定會出現低效率問題。清單14展示了這種模式的一個例子。
清單14.Schema.sql
DROPTABLEIFEXISTSauthors;
CREATETABLEauthors(
idMEDIUMINTNOTNULLAUTO_INCREMENT,
nameTEXTNOTNULL,
PRIMARYKEY(id)
);
DROPTABLEIFEXISTSbooks;
CREATETABLEbooks(
idMEDIUMINTNOTNULLAUTO_INCREMENT,
author_idMEDIUMINTNOTNULL,
nameTEXTNOTNULL,
PRIMARYKEY(id)
);
INSERTINTOauthorsVALUES(null,'JackHerrington');
INSERTINTOauthorsVALUES(null,'DaveThomas');
INSERTINTObooksVALUES(null,1,'CodeGenerationinAction');
INSERTINTObooksVALUES(null,1,'PodcastingHacks');
INSERTINTObooksVALUES(null,1,'PHPHacks');
INSERTINTObooksVALUES(null,2,'PragmaticProgrammer');
INSERTINTObooksVALUES(null,2,'Rubyalign=centerbgColor=#e7e9e9border=1>
<?php
require_once('DB.php');
$dsn='mysql://root:password@localhost/good_books';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
functionget_author_id($name)
{
global$db;
$res=$db->query("SELECTidFROMauthorsWHEREname=?",array($name));
$id=null;
while($res->fetchInto($row)){$id=$row[0];}
return$id;
}
functionget_books($id)
{
global$db;
$res=$db->query("SELECTidFROMbooksWHEREauthor_id=?",array($id));
$ids=array();
while($res->fetchInto($row)){$ids[]=$row[0];}
return$ids;
}
functionget_book($id)
{
global$db;
$res=$db->query("SELECT*FROMbooksWHEREid=?",array($id));
while($res->fetchInto($row)){return$row;}
returnnull;
}
$author_id=get_author_id('JackHerrington');
$books=get_books($author_id);
foreach($booksas$book_id){
$book=get_book($book_id);
var_dump($book);
}
?>
如果您看看下面的代碼,您可能會想,「嘿,這才是真正的清楚明了。」首先,得到作者id,然後得到書籍列表,然後得到有關每本書的信息。的確,它很清楚明了,但是其高效嗎?回答是否定的。看看只是檢索JackHerrington的書籍時要執行多少次查詢。一次獲得id,另一次獲得書籍列表,然後每本書執行一次查詢。三本書要執行五次查詢!
解決方案是用一個函數來執行大量的查詢,如下所示。
清單16.Get_good.php
<?php
require_once('DB.php');
$dsn='mysql://root:password@localhost/good_books';
$db=&DB::Connect($dsn,array());
if(PEAR::isError($db)){die($db->getMessage());}
functionget_books($name)
{
global$db;
$res=$db->query("SELECTbooks.*FROMauthors,booksWHEREbooks.author_id=authors.idANDauthors.name=?",
array($name));
$rows=array();
while($res->fetchInto($row)){$rows[]=$row;}
return$rows;
}
$books=get_books('JackHerrington');
var_dump($books);
?>
現在檢索列表需要一個快速、單個的查詢。這意味著我將很可能必須具有幾個這些類型的具有不同參數的方法,但是實在是沒有選擇。如果您想要具有一個擴展的PHP應用程式,那麼必須有效地使用資料庫,這意味著更智能的查詢。
本例的問題是它有點太清晰了。通常來說,這些類型的n+1或n*n問題要微妙得多。並且它們只有在資料庫管理員在系統具有性能問題時在系統上運行查詢剖析器時才會出現。
結束語資料庫是強大的工具,就跟所有強大的工具一樣,如果您不知道如何正確地使用就會濫用它們。識別和解決這些問題的訣竅是更好地理解底層技術。長期以來,我老聽到業務邏輯編寫人員抱怨,他們不想要必須理解資料庫或SQL代碼。他們把資料庫當成對象使用,並疑惑性能為什麼如此之差。
他們沒有認識到,理解SQL對於將資料庫從一個困難的必需品轉換成強大的聯盟是多麼重要。如果您每天使用資料庫,但是不熟悉SQL,那麼請閱讀TheArtofSQL,這本書寫得很好,實踐性也很強,可以指導您基本了解資料庫。